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前 言 


现代 生命 学 科 的 发 展 如 果 没 有 计算 机 的 辅助 是 不 可 想象 的 ,没有 计算 机 处 理 
海量 的 基因 信息 ,就 不 可 能 有 人 类 基因 组 学 、 蛋 白质 组 学 等 的 成 就 。 随 着 和 数学 、 
物理 、 计 算 机 等 学 科 的 交叉 ,生命 科学 得 到 了 进一步 的 发 展 。 目 前 我 国生 物 学 科 人 
才 在 应 用 计算 机 进行 数据 处 理 并 解决 实际 问题 上 显得 过 于 薄弱 ,因此 相关 科技 人 
员 必 须 提高 计算 机 应 用 和 数据 处 理 水 平 ,利用 计算 机 软件 进行 生命 科学 实验 数据 
处 理 和 实验 设计 ,加 深 对 生命 过 程 的 定量 描述 和 本 质 的 了 解 。 

编写 本 书 的 出 发 点 基于 以 下 三 个 方面 

1. 现代 生命 科学 发 展 的 一 个 重要 标志 是 定量 化 和 模型 化 

现代 生命 科学 的 发 展 愈 来 愈 多 地 要 求 用 数学 的 方法 进行 定量 研究 ,建立 数学 
模型 ,以 揭示 生命 现象 的 本 质 ,加 深 对 生命 过 程 的 了 解 ,如 种 群生 态 学 模型 、 数 量 植 
物 生 理学 模型 ,数量 分 类 学 、 数 学 遗传 学 等 。 生 物 工程 更 是 如 此 ,其 主要 任务 之 一 
是 过 程 数 学 模型 的 建立 ,以 有 利于 过 程 的 参数 分 析 、 优 化 操作 与 计算 机 控制 ,如 微 
生物 生长 动力 学 模型 、 酶 催化 反应 动力 学 模型 等 。 

为 了 建立 定量 的 生命 科学 的 数学 模型 ,除了 需要 掌握 相关 学 科 如 生物 科学 与 
技术 生物 工程 ,生态 学 等 专业 基础 理论 外 , 因 生命 系统 的 复杂 性 , 亟 需 学 习 模 型 化 
方法 中 的 一 些 共性 问题 ,利用 计算 机 知识 定量 探索 复杂 生物 体 的 发 展 规律 ,以 及 生 
物 系 统 的 发 展 趋势 ,以 揭示 生命 现象 的 本 质 。 

2. 许多 生命 科学 的 数学 模型 无 法 用 经 典 的 数学 解析 法 求解 

生命 科学 及 生物 工程 提出 了 相当 多 的 复杂 数学 模型 与 数学 问题 ,对 于 求解 生 
命 科学 领域 的 复杂 数学 模型 ,经 典 的 数学 解析 法 是 无 能 为 力 的 ,必须 借助 计算 机 算 
法 求解 。 因 此 ,数值 计算 在 生命 科学 领域 占有 极其 重要 的 地 位 ,是 现代 生命 科学 发 
展 的 促进 因素 。 

读者 通过 本 书 的 学 习 , 应 能 掌握 各 种 算法 的 原理 及 MATLAB 软件 在 生命 科 
学 数据 处 理 中 的 应 用 , 按 实际 情况 选择 合理 的 算法 ,编写 适用 的 计算 机 程序 ,针对 
实际 问题 在 计算 机 上 算出 正确 结果 ,从 而 根据 结果 说 明 数 学 模型 的 物理 意义 ,如 种 
群生 长 动力 学 的 物理 意义 等 。 


3. 计算 机 软件 工程 方兴未艾 

生命 科学 的 发 展 ,使 有 关 的 数据 、 信 息 极其 丰富 。 为 便于 数据 处 理 和 实际 问题 
的 解决 ,目前 已 涌现 大 量 与 生命 科学 有 关 的 计算 机 软件 ,这 为 解决 实际 问题 提供 了 
相当 方便 的 条 件 。 

为 了 科研 工作 的 顺利 开展 ,科技 人 员 应 该 了 解 与 生命 科学 相关 的 软件 工程 的 
发 展 。 读 者 通过 本 书 的 学 习 , 应 能 非常 方便 迅速 地 利用 相关 的 软件 ,特别 是 目前 国 
际 通用 的 数学 软件 MATLAB, 解 决 实 际 问题 ,如 生物 信息 检索 与 利用 、 生 物 统计 
学 ,生命 科 学 数学 模型 等 。 

本 书 以 MATLAB 语言 为 工具 ,以 应 用 为 目的 ,阐述 生命 科学 数据 处 理 中 的 共 
性 问题 ,内 容 包 括 生 命 科学 中 的 数值 方法 、 生 物 统计 学 、 生 命 科学 实验 数据 处 理 、 生 
命 科 学 中 的 数学 模型 及 其 求解 、 生 命 科 学 实验 设计 ,以 及 生命 科学 中 的 常用 软件 和 
生物 信息 检索 与 利用 等 ,具体 实例 涉及 生命 科学 中 的 各 个 领域 ,如 微生物 学 、 遗 传 学 、 
生物 工程 .分 子 生物 学 、 生 态 学 等 。 

目前 虽然 数学 建 模 、 算 法 、 实 验 设计 等 内 容 在 国内 外 已 有 许多 专著 和 译 著 , 但 
大 多 数 侧重 于 计算 机 和 数学 知识 ,过 于 数学 化 ,而 在 生命 科学 中 的 应 用 实例 较 少 ， 
体现 出 系统 性 专业 性 不 够 。 从 事 生 命 科 学 研究 的 专业 人 士 阅读 这 些 书 也 较 困难 ， 
一 般 读 者 即使 学 过 了 ,也 不 知 如 何在 生命 科学 研究 中 进行 应 用 。 

近 几 年 迅速 发 展 起 来 的 计算 生物 学 这 一 新 兴 交 叉 学 科 , 其 所 要 求 的 数学 基础 
和 计算 机 基础 超出 了 生物 学 科 本 科 生 甚至 研究 生 的 要 求 。 对 于 生命 科学 技术 人 员 
来 说 ,学 习 本 书 的 目的 在 于 了 解 实验 数据 实验 信息 的 基本 处 理 方法 ,从 众多 的 实 
验 数 据 中 得 到 对 自己 有 用 的 数据 ,从 中 探索 数据 变化 的 规律 ,提高 分 析 数 据 和 处 理 
数据 的 能 力 。 本 书 通过 综合 生命 科学 方面 的 实例 .数据 和 数学 模型 , 了解 计 算 机 在 生 
命 科 学 的 数据 处 理 与 分 析 、 实 验 数据 模型 化 中 的 应 用 。 

本 书 由 张 雪 洪 、 胡 洪波 编著 ,其 中 张 雪 洪 编写 了 第 一 、 第 二 、 第 十 至 第 十 六 章 ， 
胡 洪波 编写 了 第 三 至 第 九 章 , 并 由 胡 洪 波 负 责 对 本 书 的 MATLAB 程序 作 了 调试 。 
书 中 引用 的 实例 来 自 各 种 公开 文献 ,在 此 一 并 向 原作 者 表示 感谢 。 由 于 作者 水 平 
有 限 , 本 书 存 在 的 不 足 之 处 ,恳请 广大 读者 批评 指正 。 


编 者 
2013 年 1 月 于 上 海 
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第 一 节 ”生命 科学 数据 处 理 与 计算 机 应 用 


随 着 生命 科学 和 计算 机 技术 的 发 展 ,计算 机 在 生命 科学 领域 中 的 应 用 越 来 越 
普遍 ,计算 机 已 广泛 应 用 于 微生物 学 ,遗传 学 、 生 态 学 医学、 人口 学 药物 动力 学 、 
生理 学 .分 子 生物 学 等 领域 。 同 时 ,生物 信息 学 .数值 方法 ,数据 模型 化 .最 优化 实 
验 设计 等 在 生命 科学 中 越 来 越 显 示 出 强 有 力 的 作用 。 

总 体 而 言 ,生命 科学 领域 中 的 计算 机 应 用 起 步 较 晚 ,这 主要 是 因为 生命 过 程 非 
常 复杂 ,影响 因素 众多 ,内 在 机 理 研究 难以 深入 ,其 具体 的 定量 方法 远 远 不 能 满足 
要 求 ,需要 人 们 对 其 进一步 研究 和 探索 。 同 时 ,生命 科学 也 逐步 从 经 验 科 学 向 理论 
科学 发 展 ,这 对 生命 科学 工作 者 提出 了 较 高 的 数学 和 计算 机 应 用 的 要 求 。 如 以 计 
算 机 数据 分 析 应 用 较 多 的 微生物 发 酵 领域 为 例 , 影 响 微生物 发 酵 过 程 的 参数 很 多 ， 
综述 如 下 : 

物理 参数 :温度 .压力 .搅拌 速度 .输入 功率 ,气体 流量 ,液体 流量 .黏度 .泡沫 程 
度 .发酵 液体 积 和 发 酵 液 密 度 等 。 

生化 参数 : 溶 氧 和 溶解 的 二 氧化 碳 、 排 出 的 氧 浓 度 .排出 的 二 氧化 碳 浓 度 .基质 
浓度 (如 蛋白 质 、 糖 ) 产物 浓度 . 菌 数 .代谢 物 浓度 .酸度 和 细胞 内 组 分 含量 (ODNA、 
RNA、ATP、ADP) 等 。 

还 有 为 了 达到 以 上 各 个 参数 要 求 的 控制 参数 ,如 :加 入 的 酸 , 碱 量 和 浓度 、 消 泡 
剂量 \ 溶 液 稀释 率 、 前 体 、 诱 导 剂 等 。 

同时 微生物 发 酵 系统 还 是 一 个 非 线性 , 非 静态 , 非 稳 态 的 多 变量 输入 输出 系 
统 , 因 此 系统 的 计算 机 应 用 相当 复杂 。 如 计算 机 在 青霉素 发 酵 的 仿真 中 的 应 用 
( 见 图 1 - 1) ,以便 对 发 醇 工艺 进行 自动 控制 ,仿真 系统 的 左 网 络 指 各 种 操作 变量 
与 发 酵 的 状态 变量 及 有 关 计算 变量 之 间 的 关系 , 右 网 络 指 各 种 状态 变量 与 青霉素 
产 出 之 间 的 关系 ,要 建立 整个 系统 的 数学 模型 ,了 解 各 个 参数 之 间 的 相互 作用 及 应 
答 关 系 非常 困难 。 另 外 ,计算 机 在 微生物 发 酵 过 程 的 应 用 是 多 方面 的 ,包括 生物 反 
应 和 反应 器 设计 产物 的 分 离 纯 化 、 参 数 的 测量 控制 .过 程 分 析 评价 .过 程 的 设计 放 
大 等 。 在 其 他 生命 领域 的 应 用 更 是 这 样 。 
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注 : 带 pre 前 级 的 为 相同 级 网 络 的 输出 反馈 
图 1-1 计算 机 在 青竹 素 发 醇 的 仿真 中 的 应 用 


20 世纪 80 年 代 起 ,现代 生物 技术 和 分 析 测 试 方法 的 迅速 发 展 , 极 大 地 丰富 了 
生命 科学 的 数据 资源 ,而 且 数 据 的 质量 也 大 为 提高 。 大 量 多 样 化 的 生命 科学 数据 
资源 中 蕴含 着 大 量 重要 的 生物 学 规律 ,这 些 规律 是 我 们 解决 许多 生命 之 谜 的 关键 
所 在 。 面 对 如 此 繁杂 数据 的 分 析 处 理 , 采 用 传统 的 一 些 手段 已 力不从心 ,只 有 借助 
计算 机 的 应 用 ,才能 逐步 实现 。 

计算 机 在 生命 科学 中 的 应 用 ,总 体 上 可 分 为 以 下 五 种 类 型 ; 

(1) 计算 机 在 生命 科学 领域 的 数据 采集 。 实 验 数据 的 在 线 检测 ,如 常规 的 温 
度 . 压 力 .pH 值 溶 氧 浓度 ;生物 医学 中 的 葡萄 糖 浓 度 、 脑 电流 等 生物 电信 号 ;实验 
数据 的 离线 检测 ,如 蛋白 质 浓度 、 酶 活 ; DNA、RNA 等 核酸 浓度 的 测定 ,代谢 中 间 
产物 等 生物 特性 物质 的 检测 ,生物 种 群 数目 的 统计 等 。 由 于 生物 数据 的 量 大 面 广 ， 
依靠 传统 的 人 工 采集 数据 的 方法 已 不 能 适应 需要 。 

以 往 ,计算 机 在 线 检测 生命 科学 的 参数 是 相当 困难 的 。 生 物 数据 采集 的 需求 
促进 了 新 型 生物 传感器 的 设计 和 研究 的 快速 发 展 ,利用 生物 物质 和 酶 等 生物 分 子 
之 间作 用 产生 的 光 、 电 、 热 ,质量 等 可 以 定量 的 物质 ,进行 数学 定量 建 模 和 计算 , 研 
究 其 相互 之 间 的 关系 ,通过 计算 机 自动 信号 处 理 , 测 定 氨基 酸 、 胆 固 醇 糖 .AMP、 
维生素 等 的 浓度 。 利 用 这 一 原理 , 制 成 各 种 酶 电极 、 细 胞 电极 、 生 物 分 子 电极 及 其 
检测 系统 等 。 对 生物 传感器 ,要 求 其 测量 误差 小 ,灵敏 度 高 ,响应 快 ,信号 转换 快 ， 
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此 生物 传感器 及 生化 测量 仪器 必然 要 应 用 计算 机 技术 ,特别 是 进行 大 量 数据 采 
集 处 理 的 仪器 ,如 色谱 仪 . 质 谱 仪 .核磁 共振 仪 等 。 

(2) 计算 机 对 生命 科学 实验 数据 的 处 理 。 包 括 生 命 科学 中 各 种 实验 数据 的 处 
理 ,生命 科学 数学 模型 的 建立 和 求解 ,利用 数学 模型 对 实验 的 控制 和 实验 监测 , 实 
验 跟踪 生物 量 \ 生 物 参 数 ,以 及 生命 科学 和 生物 工程 的 实验 设计 包括 最 优化 实验 设 
计 。 如 将 所 测定 的 与 DNA 序列 对 应 的 光谱 数据 进行 整理 和 处 理 后 确定 核 苷 酸 的 
位 置 ;放射 性 示 踪 物 在 生物 分 子 中 的 研究 应 用 ;利用 计算 机 按 分 子 量 大 小 或 其 他 特 
性 自动 分 离 生 物 物质 ;利用 计算 机 对 生物 工厂 进行 工艺 优化 设计 ,对 实验 测量 值 的 
误差 进行 自动 分 析 处 理 等 。 

基因 芯片 技术 是 基因 研究 领域 中 一 项 非常 重要 和 关键 的 实验 技术 ,对 该 技术 
所 产生 的 大 量 实验 数据 ,也 必须 采用 计算 机 进行 高 效 分 析 , 从 中 获得 基因 研究 的 众 
多 信息 。 

在 所 有 的 数据 处 理 和 数据 分 析 中 ,应 用 计算 机 建立 和 求解 生命 科学 领域 的 数 
学 模型 意义 非常 重大 ,而 且 生 命 科 学 数学 模型 化 的 研究 正 逐 步 由 静态 向 动态 发 展 。 

计算 生物 学 (computational biology) 实 际 上 是 综合 性 、 系 统 性 的 处 理 复杂 生命 
科学 实验 数据 的 新 兴学 科 。 运 用 大 规模 高 效 的 数据 分 析 , 统 计 学 、 信 息 论 、 集 合 论 
等 数学 与 计算 机 理论 方法 ,用 数学 建 模 、 计 算 机 仿真 (或 人 工 智能 ) 等 技术 对 生物 数 
据 进行 处 理 ,包括 代谢 网 络 的 优化 ,药物 结构 分 析 、 基 因 组 序列 识别 等 。 计 算 生 物 
学 利用 其 卓越 的 数值 计算 能 力 进行 生物 学 的 研究 。 它 处 理 的 是 数量 巨大 的 生物 学 
资料 ,数据 及 对 其 进行 复杂 的 计算 。 要 达到 上 述 计算 生物 学 的 目标 ,不 仅 需要 先进 
的 计算 机 硬件 ,合适 而 且 高 效 的 软件 或 设计 优良 的 演算 方法 也 是 必须 的 。 

(3) 计算 机 在 生物 信息 学 中 的 应 用 。 计 算 机 对 生物 信息 的 处 理 是 数据 处 理 中 
的 一 个 特殊 部 分 ,由 于 生物 信息 学 的 迅速 发 展 , 这 已 成 为 一 个 单独 的 应 用 领域 。 生 
物 信息 学 是 以 计算 机 为 工具 对 生物 信息 进行 储存 .检索 .传输 和 分 析 的 学 科 , 涉 及 
范围 很 广 ,其 研究 重点 一 般 为 两 个 方面 , 即 基因 组 学 (genomics) 和 和 蛋白质 组 学 
《proteomics)。 它 们 涉及 对 核酸 和 和 蛋 白质 序列 信息 的 获取 分析 和 存储 ,数据 的 查 
询 和 校对 等 ,包括 对 大 量 基 因 组 数据 、 蛋 白质 组 数据 信息 ,如 GenBank、 生 物 分子 结 
构 数 据 库 MMDB, 以 及 生物 类 文献 , 如 MEDLINE 数据 库 和 BA (biological 
abstract) 数 据 库 的 检索 等 。 

在 组 白 质 结构 的 分 析 和 功能 的 预测 方面 ,蛋白 质 的 折 释 类 型 与 其 氨基 酸 序列 
具有 相关 性 ,这 样 就 有 可 能 直接 从 蛋白 质 的 氨基 酸 序列 通过 计算 机 辅助 方法 预测 
出 蛋白 质 的 三 维 结构 。 而 由 于 蛋白 质 以 及 一 些 核酸 、 多 糖 的 三 维 结构 获得 精确 测 
定 , 基 于 生物 大 分 子 结构 知识 的 计算 机 辅助 药物 设计 也 成 为 了 当前 的 热点 。 

人 类 基因 组 计划 需要 对 测定 的 30 亿 个 碱 基 、3 万 个 基因 进行 分 析 和 定位 , 进 
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而 弄 清 楚 其 中 所 有 功能 单位 的 组 织 结构 形式 以 及 调节 机 制 ,没有 计算 机 的 帮助 是 
难以 想象 的 。 近 几 年 基因 组 学 、 蛋 白质 组 学 .代谢 组 学 等 的 飞速 发 展 ,提供 了 海量 
的 实验 数据 ,迫切 需要 发 展 新 的 数据 分 析 技术 和 计算 机 软件 ,以 快速 获取 所 希望 的 
数据 和 信息 。 除 了 基因 、 蛋 白质 等 信息 外 ,生物 信息 学 的 研究 可 提供 生物 大 分 子 及 
其 空间 结构 的 信息 ,还 能 提供 电子 结构 包括 能 级 、 表 面 电荷 分 布 . 分 子 轨道 相互 作 
用 以 及 动力 学 行为 等 的 信息 ,如 生物 化 学 反应 中 的 能 量变 化 .电荷 转移 .构象 变化 
等 。 生 物 信息 学 的 理论 模拟 还 可 研究 包括 生物 分 子 及 其 周围 环境 的 复杂 体系 和 生 
物 分 子 的 量子 效应 等 。 

(4) 计算 机 数值 方法 在 生命 科学 中 的 应 用 。 事 实 上 ,实验 数据 的 处 理 ,包括 生 
物 信息 学 的 数据 处 理 , 都 是 以 数值 方法 和 统计 学 的 知识 为 基础 的 。 现 代 生 命 科 学 
提出 相当 多 的 数学 问题 及 复杂 的 数学 模型 ,涉及 许多 非 线性 的 代数 或 微分 方程 ,这 
些 方程 常常 是 大 量 耦 合 的 。 对 于 这 类 复杂 的 数学 模型 的 研究 ,经 典 的 数学 解析 法 
是 无 能 为 力 的 ,必须 借助 数值 方法 应 用 计算 机 求解 。 因 此 ,计算 机 数值 法 在 生命 科 
学 领域 内 占有 极其 重要 的 地 位 ,是 现代 生命 科学 技术 发 展 的 促进 因素 。 

数值 方法 又 称 非 直接 解法 , 它 应 用 算术 运算 求解 实际 数学 问题 ,其 求解 结果 是 
近似 且 离 散 的 。 在 现代 科学 研究 和 工程 计算 中 ,计算 机 数值 方法 已 成 为 研究 人 员 
和 工程 技术 人 员 必 不 可 少 的 手段 。 

绝 大 多 数 实际 问题 的 求解 采用 经 典 的 解析 方法 并 不 适宜 ,甚至 很 难得 到 结果 。 
例如 五 次 以 上 的 多 项 式 方 程 就 没有 公式 解法 ,所 有 的 超越 方程 更 没有 公式 解 ;有 的 
问题 虽 有 解析 解 , 但 由 于 函数 关系 太 复杂 ,其 实用 价值 也 不 大 。 尽 管 图 解法 通常 可 
用 来 解决 复杂 计算 问题 ,但 只 限于 有 限 的 能 应 用 三 维 或 更 低 维 图 形 求解 的 实际 数 
学 问题 , 且 结 果 很 不 准确 ,另外 ,无 计算 机 帮助 的 图 解法 非常 费时 甚至 很 难 实现 。 
因此 ,采用 计算 机 数值 方法 求解 实际 问题 已 成 为 一 种 重要 的 处 理 方法 。 只 要 掌握 
数值 方法 ,合理 地 选择 ,使 用 或 编写 计算 机 程序 ,就 能 够 利用 计算 机 解决 实际 数学 
及 计算 问题 。 

由 于 数值 方法 的 发 展 和 许多 实际 问题 的 提出 ,计算 机 数值 计算 软件 已 大 量 涌 
现 。 子 程序 库 的 存量 逐年 迅速 增加 ,为 生命 科学 技术 人 员 解 决 科 学 与 工程 问题 提 
供 了 便利 的 条 件 。 但 是 对 于 缺乏 数值 方法 知识 和 应 用 能 力 的 人 而 言 , 绝 不 可 能 有 
效 地 应 用 这 些 子 程序 解决 实际 计算 问题 。 因 为 在 使 用 任何 精密 而 完善 的 子 程序 去 
解决 具体 问题 时 ,很 可 能 遇 到 种 种 难题 ,这 些 困 难 可 能 由 如 下 某 些 原因 所 引起 : 数 
学 模型 没有 准确 地 反映 实际 生命 现象 和 过 程 , 选 用 的 数值 方法 不 恰当 ,方法 的 误差 
超过 实际 问题 允许 的 误差 ,选用 子 程序 的 实际 使 用 条 件 不 恰当 ,在 解决 具体 工程 问 
题 时 未 能 对 子 程序 做 相应 的 修改 或 调整 ,等 等 。 实 际 上 ,在 应 用 程序 或 使 用 任何 子 
程序 时 ,都 需要 用 户 根据 实际 问题 进行 二 次 开发 。 至 于 在 众多 的 子 程序 中 选择 适 





9 











合 于 解决 具体 计算 问题 的 最 优 子 程序 , 则 需要 更 为 坚实 的 数值 方法 基础 。 因 此 , 掌 
担 数值 方法 对 于 生命 科学 技术 人 员 是 相当 重要 的 。 

(5) 计算 机 用 于 生物 工程 和 生命 活动 的 过 程控 制 和 过 程 监督 。 如 在 发 酵 工 程 
中 ,控制 方式 有 人 工控 制 和 计算 机 控制 两 种 ,但 目前 大 部 分 还 是 以 人 工控 制 或 半 人 
工控 制 为 主 , 包 括 经 典 的 自动 控制 ,顺序 控制 .模拟 控制 等 。 计 算 机 全 自动 控制 能 
直接 实现 人 机 对 话 ,利用 系统 的 数学 模型 实现 过 程 优化 ,如 医学 上 人 工 血 液 输送 系 
统 ( 人 工 心脏 等 ) 的 控制 。 

过 程控 制 应 用 的 范围 较 广 ,如 生产 过 程 的 最 优化 ,包括 原料 的 成 分 配 比 、 传 递 
过 程 的 最 优化 .生产 动力 成 本 优化 .降低 生产 劳动 强度 等 。 计 算 机 在 食品 加 工 、 发 
酵 工 程 .生物 制药 .生物 环境 保护 等 生命 科学 领域 中 实现 了 大 量 的 成 功 控 制 ,提高 
了 生产 和 管理 的 经 济 效益 。 

计算 机 在 上 述 领 域 的 应 用 ,还 包括 与 以 上 领域 相关 的 计算 机 软件 的 开发 。 计 
算 机 在 生命 科学 上 的 广泛 应 用 ,大 大 促进 了 生命 科学 的 发 展 ,促进 了 我 们 对 生命 现 
象 和 人 类 自身 的 了 解 ,并 对 相关 产业 起 了 很 大 的 推动 作用 。 现 在 生命 科学 已 不 再 
是 仅仅 基于 试验 观察 的 科学 , 仅 靠 传统 的 研究 手段 是 无 济 于 事 的 ,理论 和 计算 将 发 
挥 越 来 越 巨大 的 作用 ,数学 .物理 ,计算 机 科学 将 日 益 深入 地 渗透 到 生物 学 研究 中 ， 
大 量 数据 必须 经 过 计算 机 收集 、 分 析 和 整理 后 才能 成 为 有 用 的 信息 和 知识 ,为 人 类 
所 使 用 。 

本 书 以 计算 机 应 用 为 目的 ,主要 阐述 计算 机 在 生命 科学 数据 处 理 中 的 共性 问 
题 ,内 容 包括 生物 信息 检索 与 利用 、 生 命 科 学 中 的 数值 方法 、 生 物 统计 学 ,生命 科学 
实验 数据 处 理 , 生 命 科学 中 的 数学 模型 及 其 求解 ,生命 科学 实验 设计 、 生 命 科学 中 
的 常用 软件 等 部 分 ,具体 实例 涉及 生命 科学 中 的 各 个 领域 。 重 点 介绍 生命 科学 中 
的 数值 方法 、 生 命 科学 实验 数据 处 理 和 数学 模型 。 本 书 所 涉及 的 数学 和 计算 机 基 
础 内 容 仅 是 基本 的 高 等 数学 、 线 性 代数 ,概率 论 与 数理 统计 及 计算 机 编程 知识 。 

对 于 研究 生命 科学 的 技术 人 员 来 说 ,学 习 和 应 用 纯粹 的 数值 方法 比较 困难 。 
本 书 主要 以 MATLAB 软件 为 工具 ,介绍 如 何 掌握 各 种 数值 计算 技巧 ,合理 利用 计 
算 机 解决 实际 计算 问题 ,学 习 的 重点 放 在 各 种 算法 的 应 用 上 ,而 对 某 些 数学 问题 及 
其 证 明 仅 作 一 般 性 了 解 即 可 。 学 习 数 值 方法 的 关键 不 仅 在 于 能 从 原理 上 理解 各 种 
算法 ,更 重要 的 是 合理 选择 和 应 用 这 些 算法 去 解 题 。 检 查 自 己 对 某 个 算法 是 否 掌 
握 ,要 看 能 和 否 应 用 这 种 算法 编写 适用 的 计算 机 程序 ,并 在 计算 机 上 对 实际 问题 做 出 
正确 处 理 。 也 就 是 说 ,学 习 数值 方法 不 仅 要 在 理论 上 学 懂 , 而 且 要 注重 计算 机 上 的 
实践 。 本 书 中 这 一 部 分 就 是 为 使 生命 科学 领域 技术 人 员 掌 握 数值 方法 的 基本 知识 
而 编写 的 ,其 内 容 包括 非 线性 方程 求 根 .代数 方程 组 求解 .插值 法 .数值 积分 、 常 微 
分 方程 及 其 方程 组 求解 等 ,同时 列举 了 与 生命 科学 领域 有 关 的 实例 ,力图 让 读者 能 
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学 以 致 用 。 

在 生命 科学 中 ,传统 的 研究 方法 如 经 验 归纳 法 等 已 不 能 满足 学 科 发 展 的 需要 ， 
在 生物 工程 上 数学 模型 已 成 为 一 种 重要 的 研究 方法 。 现 代 生命 科学 的 发 展 越 来 越 
多 地 要 求 用 数学 的 方法 对 生命 过 程 进 行 定量 研究 ,建立 数学 模型 ,以 揭示 生命 现象 
的 本 质 。 

数据 处 理 和 实验 设计 是 一 门 综合 性 的 学 科 , 目 前 它 和 各 门 具体 学 科 相 结合 ， 
成 为 各 门 学 科 的 重要 组 成 部 分 ,并 随 着 各 门 具 体 学 科 的 发 展 一 起 发 展 。 它 和 生命 
科学 相 结合 ,被 具体 用 于 生命 科学 实验 数据 处 理 、. 生 命 科 学 的 建 模 和 生命 科学 中 的 
实验 设计 ,对 生命 科学 的 发 展 发 挥 了 积极 作用 。 本 书 中 这 一 部 分 的 具体 内 容 包括 
生命 科学 实验 数据 的 误差 及 其 分 布 、 实 验 数据 常用 的 处 理 方法 .生命 科学 中 数学 模 
型 的 建立 方法 以 及 生命 科学 中 常见 的 数学 模型 。 以 最 小 二 乘法 为 基础 ,介绍 实验 
数据 的 回归 分 析 及 其 检验 ,还 介绍 了 实验 数据 常用 的 设计 方法 .回归 正 交 设计 和 序 
贯 实验 设计 。 对 于 生命 科学 技术 人 员 来 说 ,学 习 这 部 分 内 容 的 目的 在 于 了 解 实验 
数据 的 基本 处 理 方法 ,从 众多 的 实验 数据 中 得 到 有 用 的 数据 ,从 中 探索 数据 变化 的 
规律 ,提高 分 析 数 据 和 处 理 数据 的 能 力 ,综合 生命 科学 方面 的 实例 ,数据 和 数学 模 
型 ,了 解 和 掌握 计算 机 在 生命 科学 数据 处 理 与 分 析 、 实 验 数据 模型 化 中 应 用 的 基本 
思想 和 方法 。 





第 二 节 ”生命 科学 中 常用 的 计算 机 软件 概述 


生命 科学 中 的 各 个 领域 以 及 和 生命 科学 相交 叉 的 各 学 科 , 均 开发 了 多 种 应 用 
软件 ,如 用 于 数值 计算 的 MATLAB 软件 ,药物 设计 的 分 子 构 型 软件 .微生物 发 酵 
工程 中 的 控制 软件 .生物 医学 的 仿真 软件 .计算 机 辅助 设计 AUTOCAD 等 。 从 网 
络 资源 来 看 ,国外 互联 网 上 的 生物 信息 学 .生物 软件 网 点 非常 多 ,大 到 代表 国家 级 
的 研究 机 构 , 小 到 代表 专业 实验 室 的 网 点 都 有 ,大 型 机 构 的 网 点 一 般 提 供 相 关 新 
闻 数据库 服 务 .应 用 软件 和 软件 在 线 服 务 , 小 型 科研 机 构 一 般 还 提供 自己 设计 的 
算法 、 应 用 软件 的 在 线 服务 。 下 面 简单 介绍 几 种 在 生命 科学 领域 应 用 较 广 的 一 些 
软件 。 

1. GCG 软件 

生物 信息 学 中 使 用 较 广 的 GCG (Genetics Computer Group) 软 件 主要 提供 一 
种 计算 机 集成 环境 , 它 将 大 量 序列 分 析 和 数据 库 搜索 程序 集成 在 一 起 ,可 以 访问 各 
种 不 同 来 源 的 序列 数据 库 。 它 提供 的 集成 环境 SeqLab (图 形 用 户 界面 ) 是 
Wisconsin Package 的 一 部 分 。Wisconsin Package 则 是 一 种 综合 性 的 序列 分 析 程 
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序 ,由 130 个 独立 的 程序 组 成 ,用 户 为 适应 不 同 要 求 ,可 对 其 程序 进行 组 合 使 用 。 

GCG 支持 5 种 数据 库 供 Wisconsin Package 使 用 ,分 别 是 2 种 核酸 数据 库 和 
3 种 蛋白 质数 据 库 。2 种 核酸 数据 库 是 GenBank 数据 库 和 EMBL 核酸 序列 数据 
库 , 这 2 种 数据 库 也 可 被 组 合成 为 一 个 库 , 称 为 GenEMBLPlus。3 种 蛋白 质数 据 
库 是 Protein Information Resource(PIR) 国 际 蛋 白质 序列 数据 库 .SWISS - PROT 
蛋白 质 序列 数据 库 、SP - TrEMBL 数据 库 ( 由 欧洲 生物 信息 学 研究 所 等 开发 )。 
GCG 可 以 用 于 核酸 和 和 蛋白质 序列 的 编辑 、 搜 索 、 比 较 、 分 析 等 ,还 可 用 于 进化 分 析 、 
引物 选择 等 。 但 目前 原 开发 商 Accelrys 公司 已 不 再 提供 GCG 的 程序 维护 与 更 新 
工作 ,SeqLab 已 被 Accelrys Pipeline Pilot 软件 替代 。 

2. SAS 软件 

SAS(Statistics Analysis System) 软 件 是 目前 国际 上 较 流 行 . 较 权威 的 一 种 统 
计 分 析 软 件 , 由 美国 SAS 公司 研制 ,其 版 本 不 断 更 新 , 它 可 作为 统计 计算 和 绘图 的 
工具 。 由 于 在 生命 科学 的 实验 数据 处 理 上 常 需要 应 用 回归 的 方法 和 统计 的 方法 ， 
因此 SAS 软件 被 广泛 用 于 生物 学 、 医 学 、 药 学 等 的 研究 中 。 

SAS 软件 是 模块 式 结构 ,具有 约 30 个 模块 ,其 中 常用 的 有 SAS/BASE( 基 础 ) 
模块 .SAS/STAT( 统 计 ) 模 块 .SAS/GRAPH (图 形 ) 模 块 .SAS/ETS( 预 测 ) 模 块 、 
SAS/IML( 和 矩阵 运算 ) 模 块 .SAS/QC( 质 量 控制 ) 模 块 等 。 这 些 SAS 模块 可 以 独立 
使 用 ,也 可 以 相互 结合 使 用 。SAS 软件 能 够 解决 统计 分 析 和 实验 设计 的 一 些 问题 。 

SAS 软件 的 使 用 是 建立 在 SAS 数据 库 之 上 的 ,而 实现 SAS 程序 的 成 功 应 用 
必须 由 用 户 编制 SAS 引导 程序 。SAS 引导 程序 由 一 系列 符合 SAS 语言 的 语法 规 
则 的 语句 组 成 。 尽 管 使 用 前 必须 对 SAS 语言 有 一 定 的 了 解 ,但 总 体 来 说 ,使 用 还 
是 较为 方便 的 。 

3. 数值 计算 用 的 Excel 和 MATLAB 

Excel 为 Microsoft 公司 的 产品 ,Excel 扩展 图 表 是 一 种 特制 的 数学 软件 ,用 户 
可 在 数据 行 或 列 中 输入 数据 并 运算 ,可 完成 大 量 的 报表 的 运算 和 输出 。 图 表 中 任 
何 一 个 数据 发 生 改变 时 ,软件 都 会 更 新 计算 结果 。 

Excel 内 部 也 具有 部 分 数值 计算 的 功能 ,如 方程 求解 .曲线 拟 合 和 最 优化 等 , 同 
时 Excel 以 Visual BASIC 作为 用 户 开发 应 用 的 编程 语言 ,可 用 于 数值 计算 ,另外 
Excel 也 具有 可 视 化 工具 (如 三 维 立体 作 图 ) ,将 数值 计算 和 作 图 结合 起 来 使 用 ,可 
以 进行 具有 相当 难度 的 数值 分 析 。 

MATLAB 为 Mathworks 公司 的 主要 产品 , MATLAB 出 自 MATrix 
LABoratory, 原 意 为 矩阵 实验 室 ,最 开始 是 专门 用 于 和 矩阵 计算 的 软件 。 随 着 
MATLAB 推 向 市 场 ,MATLAB 不 仅 具 有 了 数值 运算 功能 \ 符 号 运算 功能 ,而 且 还 
具有 了 数据 图 示 功 能 。 在 目前 的 最 新 版 本 MATLAB 2012a 和 2012b 中 ， 
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MATLAB 不 仅 在 数值 .符号 和 图 形 等 功能 上 有 了 进一步 增强 ,而 且 又 增加 了 一 些 
工具 箱 ,以 方便 不 同 专业 技术 人 员 使 用 。 

MATLAB 中 的 函数 和 运算 器 有 助 于 本 书 中 多 种 数值 方法 的 实现 ,这 将 在 以 
后 章节 中 作 详 细 的 介绍 。 另 外 ,MATLAB 作为 一 种 高 级 语言 , 它 不 仅 可 以 以 一 种 
人 机 交互 式 的 命令 行 指令 操作 方式 工作 ,而 且 还 可 以 如 BASIC、FORTRAN、 
PASCAL、C 等 高 级 语言 一 样 进行 程序 设计 ,编制 一 种 以 m 为 扩展 名 的 文件 , 即 M 
文件 。 由 于 MATLAB 本 身 的 特点 , M 文件 的 编制 与 BASIC、FORTRAN、 
PASCAL、C 等 比较 起 来 ,有 许多 无 法 比拟 的 优点 ,如 语言 简单 、 可 读 性 强 、 调 试 容 
易 、 调 用 方便 等 ,因此 可 以 通过 简单 编程 方便 地 实现 数值 计算 。 

4. 其 他 的 应 用 软件 

(1) DNA 分 析 软 件 :Gene Construct Kit 与 大 多 数 DNA 分 析 的 软件 不 同 , 它 
管理 并 显示 克隆 策略 中 的 分 子 构建 过 程 ,包括 分 子 构建 .电泳 条 带 。 另 外 ,还 可 以 
质粒 作 图 (有 序列 没 序列 均 可 )。 该 软件 附 有 详细 的 在 线 帮助 ,可 供 从 事 分 子 生物 
实验 人 员 和 克隆 策略 人 员 备 用 。 

(2) 蛋白 质 分 析 软 件 : MACAW 是 一 种 多 序列 构建 与 分 析 软 件 。 通 过 实施 基 
因 组 计划 ,得 到 了 大 量 的 蛋白 序列 与 DNA 序列 数据 ,但 在 如 此 多 的 数据 中 ,了解 
其 相互 关系 ,查找 有 用 的 片段 是 非常 困难 的 工作 ,这 样 一 些 片段 常常 显示 类 似 的 分 
子 结构 与 生物 特性 。 用 人 工 的 方法 不 可 能 完成 如 此 大 量 的 比较 工作 。 可 应 用 
MACAW 程序 ,借助 统计 学 方法 和 一 定 的 运算 规则 ,来 查找 这 些 片 段 。 

蛋白 序列 分 析 软 件 包 ANTHEPROT 5. 0, 包 括 了 蛋白 质 研究 领域 所 包括 的 大 
多 数 内 容 , 功 能 非常 强大 。 应 用 此 软件 包 , 使 用 个 人 计算 机 便 能 进行 各 种 蛋白 序列 
分 析 与 特性 预测 ,包括 以 下 的 多 种 功能 ,如 进行 蛋白 序列 二 级 结构 预测 ;在 蛋白 序 
列 中 查找 符合 PROSITES 数据 库 的 特征 序列 ;绘制 蛋白 序列 的 所 有 理化 特性 曲 
线 ;在 Internet 或 本 地 蛋白 序列 数据 库 中 查找 类 似 序列 ;计算 蛋白 序列 相对 分 子 质 
量 、 密 度 与 各 蛋白 残 基 百 分 组 成 ;计算 蛋白 序列 滴定 曲线 与 等 电 点 ;: 选 定 一 个 片段 
后 ,绘制 Helical Wheel 图 ;进行 点 阵 图 (Dot Plot) 分 析 ; 计算 信号 肽 潜在 的 断裂 位 
点 等 。 

(3) 搜索 查看 软件 :Vector NTI Viewer 虽然 只 是 一 个 载体 查看 软件 ,但 其 功 
能 方便 易 用 :@@ 输 入 文件 格式 广泛 ,除了 molecule documents(.gb) 是 该 公司 本 身 文 
件 格式 外 ,还 能 识别 各 种 数据 库 应 用 格式 软件 : EMBL，GenBank，FASTA， 
Sequence files。@ 全 部 或 部 分 序列 可 以 拷贝 到 剪贴 板 , 提 供给 其 他 程序 使 用 。 
@ 载 体 图 像 可 以 拷贝 到 剪贴 板 上 供给 其 他 程序 使 用 ,或 直接 成 .wmf 格式 图 像 文件 
存盘 。@ 可 以 查找 特定 序列 .ORF( 可 以 设置 相关 参数 ) .描述 载体 .限制 酶 位 点 、 一 
些 功 能 序列 和 附注 。@ 整 个 界面 由 文本 、 图 形 和 序列 三 部 分 构成 ,而 且 点 击 任意 的 
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序列 .RE 基因, 图 形 和 序列 均 会 自动 标记 到 相应 位 置 ,非常 直观 方便 。@ 载 体形 
状 可 以 圆 形 表示 ,也 可 以 线形 表示 。@ 可 进行 核酸 到 蛋白 的 翻译 。@ 图 形 可 以 放 
大 缩小 。 

(4) DNA 质粒 构建 软件 :pPDRAW 是 一 个 非常 方便 的 质粒 绘制 工具 与 DNA 
分 析 工 具 。 它 包括 DNA 序列 输入 与 分 析 、 限 制 酶 消化 分 析 以 及 环形 与 线性 DNA 
图 形 输出 等 许多 功能 。 其 主要 功能 有 :@ 对 核酸 加 以 注释 ,如 基因 起 点 。@@ 虚 拟 克 
隆 酶 切片 段 。 图 序列 修改 编辑 ,可 以 将 序列 旋转 一 定 的 碱 基 距离 ,或 将 方向 相反 。 
@ 国 分 析 限 制 性 酶 切 位 点 ,各 种 酶 切 位 点 可 以 较 自 由 地 选择 。@ORF 分 析 显 示 。 
@ 在 PCR 试验 中 计算 某 一 对 引物 作为 PCR 的 Tm 值 。@ 可 以 文本 或 图 形 方式 显 
示 结 果 。@ 可 以 导 人 的 序列 有 .txt .seq 以 及 本 身 的 . pdw, 但 不 能 导出 为 其 他 格式 。 
本 软件 还 帮助 文件 中 提供 许多 具体 操作 的 步骤 以 及 参数 , 称 之 为 help on science。 

(5) 统计 分 析 软 件 :NoSA 是 一 种 中 文 统计 软件 ,覆盖 了 绝 大 部 分 常用 的 统计 
分 析 方 法 ,融入 了 当代 数据 处 理 技术 ,从 数据 录入 与 管理 ,统计 分 析 、 绘 图 ,到 结果 
管理 ,能 满足 从 事 各 类 研究 的 学 生 、 专 家 、 学 者 对 数据 作 统 计 分 析 的 需要 。 

(6) 检索 软件 :Entrez 是 NCBI 用 来 在 网 络 上 查找 生物 资料 的 在 线 系统 ,可 以 
在 网 上 搜索 找到 相应 的 资料 :GenBank, EMBL, DDBJ 三 大 数据 库 中 的 DNA 序 
列 。@Swiss-Prot，PIR，PRF，PDB 数据 库 中 的 蛋白 序列 以 及 从 核酸 翻译 的 蛋白 
序列 。@ 基 因 组 以 及 染色 体 作 图 数据 。@ 由 pdb 衍生 的 三 维 蛋 白 结构 , NCBI 的 
Molecular Modeling Database (MMDB) 。@) 文 献 引 用 数据 库 中 的 引用 数据 。 

其 他 还 有 生化 工程 中 的 反应 器 设计 程序 、BioStat B 发 酵 饶 控制 程序 ,后 者 可 
用 来 收集 发 酵 工艺 数据 ,并 采用 模糊 控制 原理 控制 工艺 参数 ; 三 维 分 子 模型 显示 、 
编辑 与 构建 程序 ,可 以 用 各 种 模式 显示 三 维 分 子 , 可 以 将 几 个 蛋白 午 加 起 来 用 来 分 
析 结 构 类 似 性 ,比较 活性 位 点 或 其 他 有 关 位 点 ,通过 菜单 操作 与 直观 的 图 形 ,可 以 
很 容易 获得 氢 键 ,角度 .原子 距离 氨基酸 突 变 等 数据 ;介绍 生物 化 学 和 微生物 的 一 
些 基 本 原理 的 教学 模拟 软件 ;DNA 和 RNA 分 析 软 件 ;生命 科学 阅读 与 检索 软件 ; 
辅助 进行 正 交 实验 设计 等 的 统计 分 析 和 数据 处 理 软件 等 。 

总 之 , 近 几 年 计算 机 和 生命 科学 的 结合 日 趋 密切 ,研究 也 越 来 越 深入 。 已 开发 
的 生命 科学 中 应 用 软件 数量 相当 多 ,应 用 非常 广 ,其 中 相当 部 分 的 软件 可 以 在 互联 
网 上 直接 下 载 使 用 。 


第 二 章 ”生物 信息 检索 与 利用 


21 世纪 是 生命 科学 的 时 代 , 也 是 信息 时 代 。 随 着 人 类 基因 组 计划 的 实施 ,有 
关 核 酸 序列 蛋白质 序列 、 蛋 白质 结 构 的 数据 呈 指 数 增长 ,而 面 对 众 多 且 复 杂 的 数 
据 , 运 用 计算 机 管理 数据 ,分 析 数 据 、 预 测 生 命 的 规律 势 在 必 行 。 从 20 世纪 80 年 
代 末 开始 ,生物 信息 学 (bioinformatics) 逐 渐 兴起 并 莲 亏 发 展 。 分 析 众 多 的 原始 数 
据 , 从 中 获得 所 需要 的 生物 结构 ,功能 的 相关 信息 ,是 基因 组 、 蛋 白质 组 研究 取得 成 
果 的 决定 性 步骤 。 基 因 组 不 仅 是 基因 的 简单 排列 , 它 有 其 特有 的 组 织 结构 和 信息 
结构 ,这 种 结构 是 在 长 期 的 演化 过 程 中 产生 的 ,也 是 基因 发 挥 其 功能 所 必需 的 。 弄 
清楚 生物 体 基因 组 特有 的 组 织 结构 和 信息 结构 ,是 解释 生命 遗传 语言 的 关键 。 





第 一 节 ”生物 信息 学 概述 


生物 信息 学 是 随 着 生物 技术 和 信息 科学 的 发 展 而 发 展 起 来 的 综合 运用 生物 
学 ,数学 ,物理 学 .信息 科学 以 及 计算 机 科学 等 诸多 学 科 的 理论 和 方法 的 新 型 交叉 
学 科 。 生 物 信息 学 采用 数据 管理 技术 、 数 学 分 析 模 型 .计算 机 软件 ,对 各 种 生物 信 
息 进行 提取 、 处 理 、 存 储 和 分 析 , 以 便 了 解 生 命 现象 的 形成 模式 与 演化 规律 。 

生物 信息 学 的 内 涵 非 常 丰富 ,其 研究 重点 主要 体现 在 基因 组 学 (genomics) 和 
蛋白 质 组 学 (proteomics) 两 方面 ,简单 说 就 是 从 核酸 和 蛋白 质 序列 出 发 ,分 析 序列 
中 表达 的 结构 功能 的 生物 信息 ,其 核心 是 基因 组 信息 学 ,包括 基因 组 信息 的 获取 、 
处 理 , 存 储 、 分 配 和 解释 。 基 因 组 信息 学 的 关键 是 了 解 基因 组 的 核 苷 酸 顺序 , 即 全 
部 基因 在 染色 体 上 的 确切 位 置 以 及 各 DNA 片段 的 功能 ;发 现 蛋 白质 编码 区 的 信 
息 之 后 进行 蛋白 质 空间 结构 模拟 和 预测 ,依据 特定 蛋白 质 的 功能 进行 生物 大 分 子 
的 设计 。 了 解 基 因 表 达 的 调控 机 理 也 是 生物 信息 学 的 重要 内 容 , 根 据 生物 分 子 在 
基因 调控 中 的 作用 ,认识 人 类 疾病 的 发 生 ,诊断 和 治疗 的 规律 。 基 因 组 信息 学 的 研 
究 目 标 是 揭示 “基因 组 信息 结构 的 复杂 性 及 遗传 语言 的 根本 规律 ”, 解 释 生命 的 遗 
传 语言 。 生 物 信息 学 已 成 为 整个 生命 科学 发 展 的 重要 组 成 部 分 ,成 为 生命 科学 研 
究 的 前 沿 ,也 是 生命 科学 研究 的 重要 方法 学 之 一 。 

20 世纪 90 年 代 以 来 ,伴随 着 各 种 基因 组 测序 计划 的 展开 和 分 子 结构 测定 技 
术 的 突破 、Internet 的 普及 和 基因 测序 成 本 的 大 幅度 下 降 , 生 物 信 息 学 研究 已 进入 
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“后 基因 组 时 代 ”, 相 继 出 现 了 代谢 组 学 .功能 基因 组 学 .比较 基因 组 学 等 组 学 名 称 
及 研究 领域 。 

目前 ,在 数据 库 中 已 经 有 越 来 越 多 的 模式 生物 全 基因 组 序列 ,如 大 肠 杆 菌 、 醇 
母 . 拟 南 芥 、 线 虫 . 果 蝇 小 鼠 、 斑 马 鱼 等 ,包括 有 重要 应 用 价值 的 水 称 、 家 和 屠 等 。 其 
中 第 一 个 人 类 染色 体 全 序列 一 一 第 22 号 染色 体 的 测序 工作 已 经 在 1999 年 12 月 
完成 ,整个 人 类 基因 组 计划 工作 草图 已 在 2001 年 完成 。 人 类 全 部 23 对 染色 体 的 
3X10?" 对 脱氧 核 苷 酸 组 成 了 约 3 万 个 人 类 基因 。 这 些 基 因 是 控制 人 类 生命 活动 的 
遗传 基础 ,这 无 疑 给 基因 组 组 织 结构 和 信息 结构 的 研究 工作 提供 了 大 量 第 一 手 材 
料 , 同 时 也 为 基因 组 研究 取得 突破 性 进展 提供 了 可 能 。 人 类 对 基因 的 认识 ,将 从 以 
往 的 对 单个 基因 的 了 解 ,上 升 到 在 整个 基因 组 水 平 上 考察 基因 的 组 织 结构 和 信息 
结构 ,考察 基因 之 间 在 位 置 结构 、 功 能 、 表 达 调 控 、 致 病 突变 等 的 相互 关系 及 其 他 
信息 。 

在 此 基础 上 ,国际 人 类 基因 组 单 体型 图 计划 (简称 HapMap 计划 ) 也 于 2002 年 
开始 ,由 加 拿 大 ,中国 ,日 本 ,尼日利亚 .英国 和 美国 等 联合 进行 。 这 一 计划 的 目的 
在 于 建立 一 个 免费 向 公众 开放 的 关于 人 类 疾病 (及 疾病 对 药物 反应 ) 相 关 基 因 的 数 
据 库 。 利 用 HapMap 数据 库 , 研 究 人 员 通 过 比较 不 同 个 体 的 基因 组 序列 来 确定 染 
色 体 上 共有 的 变异 区 域 。 这 将 能 够 发 现 与 人 类 健康 、 疾病 以 及 对 药物 和 环境 因子 
的 个 体 反应 差异 相关 的 基因 。 

从 目前 生物 信息 学 的 研究 情况 来 看 ,国际 上 公认 的 生物 信息 学 的 研究 内 容 , 大 
致 包括 以 下 几 个 方面 : 

(1) 生物 信息 的 收集 ,存储 ,管理 与 提供 。 包 括 建立 国际 生物 信息 库 . 生 物 信 
息 传输 的 国际 联网 系统 ,生物 信息 数据 库 的 理论 研究 ,数据 质量 的 评估 与 检测 系统 
等 。 建 立 数据 库 是 存储 基因 信息 的 重要 步骤 ,对 大 量 原始 数据 进行 分 类 建 库 , 让 用 
户 可 以 方便 地 在 数据 库 中 查阅 检索。 同时 ,以 互联 网 为 基础 的 生物 信息 学 传输 网 
络 的 形成 ,大 大 促进 了 生物 信息 的 共享 与 交流 ,但 过 多 的 原始 数据 也 为 数据 的 筛 
选 .分 类 以 及 重要 数据 的 获得 增加 了 鉴别 工作 。 

(2) 基因 组 序列 信息 的 提取 和 分 析 。 基 因 组 学 的 根本 任务 是 破译 遗传 密码 ， 
了 解 基因 信息 ,包括 新 基因 的 发 现 与 鉴定 ,如 利用 EST 数据 库 , 进 行 大 规模 平行 计 
算 发 现 新 基因 和 新 SNPs( 单 核 苷 酸 多 态 性 ) 以 及 各 种 功能 位 点 ;从 基因 组 DNA 测 
序数 据 中 确定 编码 区 等 ,编码 区 包括 起 始 密码 子 、 终 止 密码 子 的 独特 信息 。 同 时 ， 
根据 编码 区 和 非 编 码 区 的 碱 基 组 成 的 不 同 ,对 具有 重要 生物 功能 的 非 编 码 区 中 局 
动 子 、 增 强 子 等 各 种 组 分 作 分 类 与 确定 ,寻找 新 的 非 三 联 体 的 编码 方式 ,研究 编码 
区 与 非 编码 区 中 信息 调节 规律 等 ,找到 这 些 区 域 的 编码 特征 ,调节 信息 与 表达 规 
律 ; 进 行 模式 生物 完整 基因 组 的 信息 结构 分 析 和 比较 研究 ;利用 基因 组 信息 研究 遗 
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传 密码 起 源 、 基 因 组 结构 的 演化 、 基 因 组 空间 结构 与 DNA 折合 的 关系 ,以 及 研究 
基因 组 信息 与 生物 进化 关系 等 生物 学 的 重大 问题 。 

(3) 功能 基因 组 相关 信息 分 析 。 包 括 大 规模 基因 组 测序 的 信息 分 析 , 完整 基 
因 组 的 比较 、 表 达 研 究 , 基 因 表达 调控 网 络 的 研究 ,与 基因 组 信息 相关 的 核酸 、 蛋 白 
质 空间 结构 的 预测 和 模拟 ,以 及 蛋白 质 功能 预测 的 研究 。 

(4) 生物 大 分 子 结构 模拟 。 包 括 DNA 和 RNA 等 核酸 的 结构 模拟 和 RNA 的 
分 子 设计 ;和 蛋白质 空 间 结 构 模 拟 和 分 子 设计 ;具有 不 同 功能 域 的 融合 蛋白 质 以 及 融 
合 蛋 白质 之 间 的 连接 肽 (linker) 设 计 ; 生 物 活性 分 子 的 电子 结构 计算 和 设计 ,电子 
结构 模拟 ;纳米 生物 材料 的 模拟 与 设计 等 。 

(5) 药物 设计 的 新 方法 与 新 技术 。 传 统 的 药物 研制 主要 是 对 大 量 的 天 然 产 
物 ,如 动物 植物、 微生物 进行 第 选 ,因此 得 到 一 个 临床 药物 相当 困难 ,周期 长 , 且 费 
时 费力 。 近 年 来 相当 数量 的 蛋白 质 以 及 部 分 核酸 、 糖 类 的 三 维 结构 已 被 人 们 精确 
测定 ,使 得 基于 蛋白 质 和 核酸 结构 的 药物 设计 成 为 可 能 。 随 着 实验 技术 的 进步 和 
理论 方法 的 发 展 ,一 旦 知道 了 生物 大 分 子 的 三 维 结构 ,根据 药物 分 子 与 大 分 子 的 互 
补 原理 ,可 在 受 体 结构 的 基础 上 反 过 来 设计 药物 分 子 , 此 即 为 基于 结构 的 药物 设 
计 ; 其 他 类 似 的 有 基于 酶 结构 、 功 能 蛋白 质 结构 ,细胞 表面 受 体 结构 等 的 药物 设计 。 

(6) 生物 信息 分 析 的 技术 与 方法 研究 。 包 括 发 展 有 效 的 能 支持 大 尺度 作 图 与 
测序 需要 的 软件 .数据 库 以 及 若干 数据 库 工 具 ; 引 入 复杂 系统 分 析 技 术 、 信 息 系 统 
分 析 技 术 ; 研 究 分 析 相 关 的 算法 、 软 件 , 建 立 严格 的 多 序列 比较 方法 ,发 展 与 应 用 密 
码 学 方法 以 及 其 他 算法 和 分 析 技 术 。 还 可 进行 数据 库 搜 索 中 的 序列 错误 影响 的 分 
析 , 开 发 新 的 数据 库 搜索 和 多 重 序列 对 齐 算法 ,建立 非 元 余 序 列 数据 库 以 及 序列 相 
似 性 的 统计 显著 性 评估 的 数学 模型 。 

为 解释 基因 组 的 信息 ,探索 DNA 序列 及 其 空间 结构 信息 的 新 表征 ,应 特别 发 
展 研究 基因 组 完整 信息 结构 和 信息 网 络 的 研究 方法 ,改进 现 有 的 理论 分 析 方法 ,如 
统计 方法 .马尔 科 夫 过 程 方法 、 分 维 方法 、 神 经 网 络 方法 .复杂 性 分 析 方 法 、 密 码 学 
方法 等 。 创 建 一 切 适用 于 基因 组 信息 分 析 的 新 方法 、 新 技术 。 建 立 严格 的 多 序列 
比较 方法 ,多 序列 比较 是 解决 同 源 性 分 析 等 重要 问题 的 关键 手段 。 虽 然 目 前 两 个 
序列 比较 已 有 动态 规划 算法 这 样 的 精确 方法 ,但 还 要 发 展 更 为 精确 的 多 序列 比较 
方法 。 

(7) 生物 信息 学 的 应 用 。 生 物 信 息 学 的 发 展 将 会 对 生命 科学 带 来 重大 变革 。 
它 的 成 果 不 仅 对 相关 基础 学 科 起 巨大 的 推动 作用 ,而 且 还 将 对 医药 卫生、 农业 、 环 
境 等 领域 产生 巨大 的 影响 ,甚至 引发 新 的 产业 革命 。 如 汇集 与 疾病 相关 的 人 类 基 
因 信息 ,进行 基因 疾病 的 诊断 ,发 展 患者 样品 序列 信息 检测 技术 和 基于 序列 信息 选 
择 表达 载体 .引物 的 技术 。 人 类 的 很 多 疾病 与 基因 有 着 密切 的 关系 ,包括 癌症 、 肥 
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胖 .哮喘 等 疾病 在 内 的 致 病 基因 已 经 发 现 ,并 用 于 这 些 疾病 的 治疗 。 随 着 基因 组 信 
息 学 的 深入 研究 ,在 掌握 了 全 部 人 类 基因 在 染色 体 上 的 位 置 和 序列 特征 后 ,通过 比 
较 序列 库 中 的 序列 同 源 性 ,可 以 得 到 序列 之 间 的 进化 关系 ,建立 基因 序列 结构 和 功 
能 的 关系 ,各 种 分 子 疾患 就 可 有 效 地 判定 并 加 以 治疗 。 又 如 建立 与 动 植物 良种 繁 
育 相 关 的 数据 库 , 随 着 人 类 基因 组 ,水 稻 基 因 组 以 及 各 种 模式 生物 基因 组 的 解释 ， 
根据 不 同 物种 间 的 进化 距 , 对 优良 性 状 的 决定 基因 将 有 更 全 面 的 了 解 。 良 种 的 选 
育 也 将 从 现在 通过 个 别 基因 的 转移 来 改进 个 别 性 能 ,进入 到 整体 性 能 的 改善 。 

特别 要 注意 在 利用 生物 信息 学 方法 进行 结构 和 功能 预测 时 ,对 于 同一 问题 采 
用 不 同 算法 ,可 能 产生 相同 或 不 同 的 结果 。 因 此 ,必须 弄 清楚 某 种 方法 的 基本 原 
理 , 而 不 是 仅 把 算法 当 作 一 个 “黑箱 ”。 因 为 某 种 方法 对 特定 实例 很 适用 ,而 可 能 对 
其 他 实例 完全 不 适用 ,这 也 说 明了 生命 现象 本 身 的 复杂 性 。 

生物 信息 学 必 将 对 药物 学 、 医 学 及 生物 技术 的 发 展 产生 强大 推动 作用 。 因 此 ， 
各 国政 府 和 工业 界 对 此 极为 重视 ,投入 了 大 量 资金 。 欧 美 各 国 及 日 本 相继 成 立 了 
生物 信息 数据 中 心 , 如 美国 的 国家 生物 技术 信息 中 心 (NCBI) 和 国家 基因 组 资源 中 
心 ,英国 的 欧洲 生物 信息 研究 所 日 本 的 国家 遗传 学 研究 所 等 。 以 西欧 各 国 为 主 的 
欧洲 分 子 生物 学 网 络 组 织 (European Molecular Biology Network，EMBNet), 是 目 
前 国际 最 大 的 分 子 生物 信息 研究 、 开 发 和 服务 机 构 , 通 过 计算 机 网 络 使 英 、 德 法、 
瑞士 等 国生 物 信息 资 源 实现 共享 。 我国 的 许多 大 学 和 研究 所 也 开展 了 生物 信息 学 
的 研究 。 

由 于 生物 信息 学 覆盖 面 广 ,内 容 丰富 ,限于 篇 幅 , 本 章 不 可 能 将 生物 信息 学 的 
全 部 内 容 详细 加 以 讲述 ,只 能 针对 目前 生物 信息 学 的 主要 研究 内 容 一 一 核酸 与 蛋 
白质 的 数据 库 内 容 , 与 数据 搜索 ,分 析 密 切 相关 的 生物 信息 学 策略 及 实用 工具 进行 
简单 介绍 。 生 物 信 息 学 的 详细 内 容 和 最 新 信息 可 查阅 相关 书籍 期刊. 数据 库 、 生 
物 信 息 学 网 站 等 。 总 之 ,生物 信息 学 是 发 展 迅速 的 新 兴 交 叉 学科, 该 学 科 的 研究 日 
新 月 异 , 将 对 生命 科学 产生 重大 影响 。 





第 二 节 ”常用 的 生物 信息 数据 库 


近年 来 大 量 生物 学 实验 数据 的 积累 ,已 形成 了 数 以 百 计 的 重要 生物 信息 数据 
库 。 它 们 各 自 按 一 定 的 范围 和 目标 收集 和 整理 生物 学 实验 数据 ,并 提供 相关 的 数 
据 查 询 ,数据 处 理 的 服务 。 这 些 数据 库 大 多 是 公开 和 免费 的 ,可 以 通过 互联 网 来 访 
问 ,或 者 通过 互联 网 络 下 载 。 也 有 一 些 属于 商业 数据 库 如 MDL 等 ,需要 预先 注册 
和 付费 才能 检索 。 特 别 是 国际 性 合作 的 几 个 基因 组 计划 已 经 积累 了 无 数 的 生物 信 
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息 资源 ,并 以 不 同 的 组 织 形式 构成 许多 数据 库 。 随 着 生命 科学 的 研究 深入 ,公共 数 
据 库 中 资源 将 越 来 越 多 ,它们 将 成 为 世界 各 地 生物 学 家 的 重要 数据 来 源 。 

一 般 而 言 , 这 些 生物 信 息 数 据 库 可 以 分 为 一 级 数据 库 和 二 级 数据 库 。 一 级 数 
据 库 的 数据 都 直接 来 源 于 实验 获得 的 原始 数据 ,只 经 过 简单 的 归 类 整理 和 注释 ;二 
级 数据 库 是 在 一 级 数据 库 的 实验 数据 分 析 的 基础 上 针对 特定 目标 衍生 而 来 ,是 对 
生物 学 知识 和 信息 的 进一步 整理 。 国 际 上 著名 的 一 级 核酸 数据 库 有 GenBank 数 
据 库 .EMBL 核酸 库 和 DDBJ 库 等 ;一 级 蛋白 质 序列 数据 库 有 SWISS - PROT、 
PIR 等 ;蛋白 质 结构 库 有 PDB 等 。 国 际 上 二 级 生物 信息 数据 库 非常 多 ,它们 因 针 
对 不 同 的 研究 内 容 和 研究 目的 而 各 具 特 色 , 如 人 类 基因 组 图 谱 库 GDB、 转 录 因 子 
和 结合 位 点 库 TRANSFAC 蛋白质 结构 家 族 分 类 库 SCOP 等 。 

建立 数据 库 是 生物 信息 学 的 重要 内 容 , 当 前 在 Internet 上 可 找到 的 各 种 数据 
库 几 乎 覆盖 了 生命 科学 的 各 个 领域 。 这 众多 的 数据 库 中 有 核酸 序列 数据 库 、 蛋 
白质 序列 数据 库 .三 维 结构 数据 库 .与 蛋白 质 结构 相 关 的 数据 库 .与 基因 组 有 关 
的 数据 库 ( 如 基因 突变 ,病理 .免疫 学 .基因 调控 ,代谢 途径 数据 库 等 ), 还 有 文献 
数据 库 如 Medline、Uncover 等 。 仅 农林 、 医 、 家 畜 专 业 领 域 的 数据 库 就 达 数 
百 种 。 

下 面 简要 介绍 一 些 著名 和 有 特色 的 核酸 与 蛋白 质 相关 生物 信息 数据 库 。 


一 、 核 酸 及 其 相关 数据 库 


1, 核酸 序列 数据 库 

BIOSINO 一 一 我 国 的 核酸 序列 公共 数据 库 。 

EMBL 一 一 EMBL Nucleotide sequence database (EBI) ,欧洲 分 子 生物 学 实验 
室 (European Molecular Biology Laboratory) 核 酸 序列 数据 库 , 为 欧洲 最 主要 的 核 
酸 序列 数据 库 , 世 界 两 大 核酸 数据 库 之 一 。 目 前 此 数据 库 由 其 分 支 机 构 一 一 EBI 
(the European Bioinformatics Institute, 欧 洲 生物 信息 研究 所 ) 维 护 。 

GenBank 一 一 GenBank Nucleotide Sequence database (NCBI) ,美国 国家 生物 
技术 情报 中 心 (NCBI, National Center for Biotechnology Information) 基 因 序 列 数 
据 库 。 美 国 最 主要 的 核酸 序列 数据 库 , 世 界 两 大 核酸 数据 库 之 一 。 

DDBJ DNA database of Japan (Mishima) ,日 本 核酸 序列 数据 库 , 为 亚洲 
主要 的 核酸 序列 数据 库 。 

INSD 国际 核酸 序列 数据 库 , 由 EMBL、DDBJ 、GenBank 三 家 共同 交换 数 
据 和 维护 。 

dbEST 一 一 Database of Expressed Sequence Tags (NCBI) 序 列表 达标 记 数 
据 库 。 
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dbSTS 一 一 Database of Sequence Tagged Sites (NCBI) ,序列 标记 位 点 数 
据 库 。 

HIV Database 一 一 HIV 序列 数据 库 。 

IMGT 一 一 ImMunoGeneTics 数据 库 , 含 有 与 免疫 系统 有 关 的 核酸 序列 数据 。 

BERLIN 一 一 5S rRNA 数据 库 。 

EPD 一 一 真 核 生物 启动 子 数据 库 (Eukaryotic Promoter database，EPD) 。 

2. 基因 组 及 相关 数据 库 

GenomeWeb(HGMP) 一 一 A catalogue of useful Web sites for Genomics with 
a set of collections of genome databases。 

GSDB 一 一 Genome Sequence database (NCGR) ,序列 来 自 INSD。 

GOLD 一 一 Genomes On-line db。 

DOGS 一 Database of Genome Sizes, 基 因 组 尺寸 数据 库 。 

TRANSFAC 一 一 关于 转录 因子 .它们 在 基因 组 上 的 结合 位 点 和 与 DNA 结合 
的 profiles 的 数据 库 。 

TRRD 基于 真 核 生 物 基 因 调 控 区 结构 -功能 特性 的 转录 调控 区 数据 库 。 

物种 基因 数据 库 有 : 

gdb 一 一 人 类 基因 组 数据 库 。 

MGD 一 一 和 基因 组 数据 库 。 

MAIZEDB 一 一 玉米 基因 组 数据 库 。 

EMGLib 一 一 Enhanced Microbial Genomes Library ,增补 微生物 基因 组 库 。 

AtDB 一 一 拟 南 芥 基因 组 数据 库 。 

ICTVdB 一 一 病毒 数据 库 。 

DICTYDB 一 一 盘 基 网 柄 菌 (Dictyostelium Discoideum) 基 因 组 数据 库 。 

EcoGene 一 一 大 肠 杆菌 (Escherichia coli)K12 基因 组 数据 库 。 

FLYBASE 一 一 果 蝇 (Drosophila) 基 因 组 数据 库 。 

SGD 酵母 菌 (Saccharomyces) 基 因 组 数据 库 。 

STYGENE 一 一 沙门 氏 菌 (Salmonella Typhimurium)LT2 基因 组 数据 库 。 

SUBTILIST 一 一 纤 小 杆菌 (Bacillus Subtilis)168 基因 组 数据 库 。 

WORMPEP 一 蠕虫 (Caenorhabditis elegans) 基 因 组 计划 蛋白 数据 库 。 

3. 核酸 三 维 结构 数据 库 

NDB 一 一 Nucleic Acid Databank (3D structures) ,三 维 结构 核酸 数据 库 。 

BNASDB 一 一 Nucleic acid structure db from University of Pune, 核酸 结构 数 
据 库 。 
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二 、 蛋 白质 及 其 相关 数据 库 


1. 蛋白 质 序 列 和 相关 数据 库 

SWISS - PROT 一 一 SWISS - PROT annotated protein sequence db SWISS - 
PROT 蛋白 质 序列 数据 库 , 由 日 内 瓦 大 学 医学 生物 化 学 系 与 欧洲 分 子 生物 学 实验 
室 (European Molecular Biology Laboratory，EMBL) 共 同 维护 ,是 欧洲 最 主要 的 
蛋白 质 序列 数据 库 , 世 界 两 大 蛋白 质 序列 数据 库 之 一 。 

PIR-international—— The Protein Information Resource (protein sequence) 
蛋白 质 序列 鉴定 数据 库 , 由 美国 国家 生物 医学 研究 基金 会 (National Biomedical 
Research Foundation) 维 护 。 是 美国 最 主要 的 蛋白 质 序列 数据 库 ,为 世界 两 大 蛋白 
质 序列 数据 库 之 一 。 

MIPS 一 一 Martinsried institute for protein sequence and homology data and 
yeast genome information。 

PDB 一 一 Brookhaven 蛋白 质 序列 三 维 立 体 结构 数据 库 。 

PROSITE 一 一 蛋白 质 特征 序列 数据 库 。 

ENZYME 一 一 酶 数据 库 。 

REBASE 一 一 限制 酶 数据 库 。 

HSSP 一 一 同类 二 级 结构 蛋白 质 (Homology-derived secondary structure of 
proteins) 数 据 库 。 

KABAT 一 一 具有 免疫 学 重要 性 的 蛋白 质数 据 库 (Database of Proteins of 
immunological interest) 。 

OMMEGA 一 一 蛋白 质 结构 信息 数据 库 (protein structural information) 。 

TMBASE 一 一 跨 膜 蛋 白质 数据 库 , 包 括 一 些 预测 工具 。 

PROSITE 一 一 PROSITE dictionary of protein sites and patterns。 


JnterPro 一 一 Integrated Resources of Proteins Domains and Functional Sites 。 
BLOCKS 蛋白 质 序列 块 数据 库 (Protein Blocks Database) 。 
HDB 一 一 组 蛋白 质数 据 库 。 


DOMO 一 一 Protein domain db (Automatically generated) 。 

Pfam Protein families db (HMM derived) 。 

PRINTS 一 一 Protein Motif fingerprint db。 

ProDom 一 一 Protein domain db (Automatically generated) 。 

PROTOMAP 一 一 An automatic hierarchical classification of SWISS - PROT 
proteins。 

SBASE——SBASE domain db (Protein domain sequence library)。 
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SMART 一 一 Protein signalling and extracellular domain patterns (Simple 
Modular Architecture Research Tool) 。 

ProClass 

Kabat Kabat db of protein of immunological interest。 

PMD Protein Mutant db。 

DIP 一 一 相互 作用 的 蛋白 质数 据 库 。 

COGs 一 一 蛋白 质 直系 同 源 徐 数据 库 。 

2. 蛋白 质 三 维 结构 和 相关 数据 库 

PDB 一 一 Protein Data Bank 蛋白 质 结构 数据 库 。 

BioMagResBank(BMRB) 一 一 Repository for data on proteins, peptides, and 





Protein sequence alignments and curation of protein families。 











nucleic acids from NMR spectroscopy。 

SWISS - MODEL Repository 一 一 Automatically generated protein models db。 

ModBase 一 一 Db of comparative protein structure models。 

CATH UCL BSM structural classification of proteins, 蛋 白质 结构 与 功能 
关系 分 类 数据 库 。 

SCOP 一 一 Structural classification of proteins, 蛋 白质 结构 分 类 数据 库 。 

BMM Domain Server 一 一 Biomolecular Modelling Laboratory (ICRF) protein 
domain server。 

PRESAGE 一 一 Collaborative resource for structural genomics。 

ReLiBase Receptor/ligand complexes db。 

TOPS—— Protein topology atlas。 

CCDC 一 一 Cambridge Crystallographic Data Center (Cambridge Structural 
Db (CSD) ) 。 

HSSP 一 一 Homology-derived secondary structure of proteins db。 

SWISS-3DIMAGE 一 一 3D images of proteins and other biological 
macromolecules ,和 蛋白质 和 三 维 图 像 数据 库 。 

IMB 一 一 大 分 子 三 维 图 像 库 。 


Biolmage 一 一 Biological image db (contains imaging data on macromolecules) 。 


三 、GenBank 数据 库 介 绍 


GenBank 是 最 常用 的 数据 库 (http://www. ncbi. nlm. nih. gov/genbank/), 包 
含 了 所 有 已 知 的 核酸 序列 和 蛋白 质 序列 ,以 及 与 它们 相关 的 文献 著作 和 生物 学 注 
释 。 它 是 由 美国 国立 生物 技术 信息 中 心 (NCBD) 建 立 和 维护 的 。 它 的 数据 直接 来 
源 于 测序 工作 者 提交 的 序列 ,由 测序 中 心 提交 的 大 量 EST 序列 和 其 他 测序 数据 ， 
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以 及 与 其 他 数据 机 构 协作 交换 数据 而 来 ,数据 涉及 十 多 万 个 物种 。GenBank 每 天 
都 会 与 EMBL、DDBJ 交换 数据 ,使 这 三 个 数据 库 的 数据 同步 。GenBank 的 数据 可 
以 免费 下 载 。NCBI 还 提供 广泛 的 数据 查询 ,序列 相似 性 搜索 以 及 其 他 分 析 服 务 ， 
用 户 可 以 从 NCBI 的 主页 上 找到 这 些 服务 。 至 2011 年 4 月 ,GenBank 中 收集 的 序 
列 数量 达到 1 亿 3 544 万 条 ,1. 265 亿 个 碱 基 ; 另 外 ,来 自 WGS 的 序列 数量 达到 
6 271 万 条 ,914 亿 个 碱 基 ; 而 且 数 据 还 在 不 断 增长 。 

每 条 GenBank 数据 记录 包含 了 对 序列 的 简要 描述 、 科 学 命名 、 物 种 分 类 名 称 、 
参考 文献 ,序列 特征 表 , 以 及 序列 本 身 。 序 列 特征 表 里 包 含 对 序列 生物 学 特征 注释 
如 :编码 区 ,转录 单 元 ,重复 区 域 ,突变 位 点 或 修饰 位 点 等 。 所 有 数据 记录 被 划分 在 
若干 个 文件 里 ,如 细菌 类 ,病毒 类 、 灵 长 类 、 员 齿 类 ,以 及 EST 数据 ,基因 组 测序 数 
据 、 大 规模 基因 组 序列 数据 等 18 类 ,其 中 EST 数据 等 又 被 各 自分 成 若干 个 文件 。 

GenBank 及 NCBI 的 数据 库 检索 查询 系统 是 Entrez( 见 本 章 第 三 节 ) 。 

1，GenBank 的 二 级 数据 库 

GenBank 还 有 多 个 二 级 数据 库 , 主 要 如 下 ， 

(1) 表达 序列 标记 数据 库 dbEST。EST(Expressed Sequence Tags) 方 法 已 被 
证 明 是 识别 转录 序列 的 最 有 效 方法 。dbEST 数据 库 包 括 不 同 生 物 的 EST 序列 数 
据 及 其 他 相关 信息 ,主要 是 从 大 量 不 同 组 织 和 器 官 得 到 的 短 mRNA 片段 。EST 
数据 库 的 主要 作用 是 通过 搜索 比较 ,给 实验 新 得 到 的 一 条 cDNA 序列 或 基因 组 序 
列 赋予 公认 的 功能 。 通 过 对 EST 数据 库 的 逆向 分 析 , 能 识别 与 疾病 相 联系 的 
基因 。 

(2) 基因 聚 类 数据 库 UniGene。UniGene 数据 库 将 GenBank 中 的 序列 自动 分 
类 ,形成 面向 基因 群 的 非 兄 余 集合 。 每 个 UniGene 群 包含 代表 一 个 唯一 基因 的 多 
个 序列 , 附 有 该 基因 相关 的 信息 ,如 基因 表达 的 组 织 类 型 .定位 图 谱 。 除 了 基因 的 
序列 之 外 ,还 包括 大 量 的 EST 序列 。UniGene 既 可 以 作为 发 现 新 基因 的 数据 源 ， 
也 可 以 作为 生物 学 研究 人 员 进 行 大 规模 表达 分 析 的 辅助 工具 。 

(3) 序列 标记 位 点 数据 库 dbSTS。STS(Sequence Tagged Site) 是 序列 标记 位 
点 。dbSTS 是 NCBI 的 一 个 数据 源 ,也 是 GenBank 的 一 个 部 分 ,包含 已 知 的 序列 
标记 位 点 组 成 和 定位 信息 。 可 以 通过 BLAST 搜索 STS 序列 ,或 者 直接 通过 FTP 
下 载 序 列 。 

基因 组 数据 库 Entrez Gonomes。Entrez Gonomes 所 收集 的 基因 组 数据 量 非 
常 大 。 该 数据 库 还 提供 一 个 基因 组 数据 浏览 工具 Map Viewer, 利 用 这 个 工具 ,用 
户 可 以 很 方便 地 得 到 所 需要 的 数据 。 

(4) 单 碱 基 多 态 性 数据 库 dbSNP。 某 些 特定 的 SNPs 等 位 基因 被 认为 是 人 类 
遗传 疾病 的 致 病因 子 , 在 个 体 中 筛选 这 类 等 位 基因 可 以 检查 其 对 疾病 的 遗传 易 感 
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性 。dbSNP 是 由 NCBI 与 人 类 基因 组 研究 所 合作 建立 的 , 它 是 关于 单 碱 基 蔡 换 以 
及 短 插入 、 删 除 多 态 性 的 资源 库 。 

2. 向 Genbank 提交 序列 数据 

本 着 共享 的 原则 ,研究 者 需要 将 工作 中 获得 的 新 序列 提交 给 NCBI, 添加 到 
GenBank 数据 库 。 这 可 通过 基于 Web 界面 的 BankIt 或 独立 程序 Sequin 来 完成 。 

1) Banklt 

BankIt(http://www. ncbi. nlm. nih. gov/Banklt) 是 一 系列 表单 ,包括 联络 信 
息 ,发 布 要 求 ,引用 参考 信息 .序列 来 源 信息 ,以 及 序列 本 身 的 信息 等 。 研 究 者 提交 
序列 后 ,会 从 电子 邮件 收 到 自动 生成 的 数据 条 目 .GenBank 的 新 序列 编号 ,以 及 完 
成 注释 后 的 完整 的 数据 记录 。 研 究 者 还 可 以 在 BankIt 页 面 下 修改 已 经 发 布 序列 
的 信息 。BankIt 适合 于 提交 少量 序列 , 而 不 适合 大 量 序列 的 提交 及 很 长 序列 的 
提交 。 

2) Sequin 

大 量 的 序列 提交 可 以 由 Sequin(http://www. ncbi. nlm. nih. gov/Sequin) 程 
序 完成 。Sequin 程序 能 方便 地 编辑 和 处 理 复杂 注释 ,并 包含 一 系列 内 建 的 检查 孙 
数 来 提高 序列 的 质量 保证 。 它 还 被 设计 用 于 提交 来 自 系统 进化 .种群 和 突变 研究 
的 序列 ,可 以 加 入 比 对 的 数据 。Sequin 除了 用 于 编辑 和 修改 序列 数据 记录 ,还 可 以 
用 于 序列 的 分 析 , 任 何以 FASTA 或 ASN. 1 格式 序列 为 输入 数据 的 序列 分 析 程序 
都 可 以 整合 到 Sequin 程序 下 。 


第 三 节 ”数据 库 的 检索 和 应 用 


1. Entrez 和 SRS 

一 般 的 数据 库 都 有 自己 的 检索 工具 ,其 中 常用 的 有 Entrez 和 SRS 检索 工具 。 
Entrez(http://www. ncbi. nlm. nih. gov/entrez/) 是 NCBI (http://www. ncbi. 
nlm. nih. gov) 为 用 户 提供 整合 的 访问 序列 、 定 位 、 分 类 和 结构 数据 的 搜索 和 检索 系 
统 ,同时 也 提供 序列 和 染色 体 图 谱 的 图 形 视图 。Entrez 是 一 个 用 以 整合 NCBI 数 
据 库 中 信息 的 搜寻 和 检索 工具 ,这 些 数 据 库 包括 核酸 序列 、 蛋 白 序列 、 大 分 子 结 构 、 
全 基因 组 和 通过 PubMed 检索 的 文献 库 MEDLINE。Entrez 的 一 个 强大 和 独特 之 
处 是 具有 检索 相关 的 序列 、 结 构 、 参 考 文献 的 能 力 。 参 考 文献 可 通过 PubMed 获 
得 ,PubMed 是 一 个 网 络 搜索 界面 ,可 以 提供 在 文献 MEDLINE 上 的 1 000 余 万 条 的 
杂志 引用 信息 ,包含 了 从 链接 到 参与 的 出 版 商 网 络 站 点 的 全 文 检索 。 
户 可 以 利用 Entrez 界面 上 提供 的 限制 条 件 (Limits) 、 索 引 (Index) ,检索 历 , 
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史 (History) 和 剪贴 板 (Clipboard) 等 功能 来 实现 复杂 的 检索 查询 工作 。 对 于 检索 
获得 的 记录 ,用 户 可 以 选择 需要 显示 的 数据 ,保存 查询 结果 ,甚至 以 图 形 方式 观看 
检索 获得 的 序列 。 

SRS 序列 查询 系统 (Sequence Retrieval System) 是 欧洲 分 子 生 物 学 网 
EMBnet 的 主要 数据 库 检 索 工 具 , 其 作用 和 Entrez 较 接 近 。 采 用 JAVA 技术 , 连 
接 超过 350 个 数据 库 . 包 括 蛋 白质 .基因 和 基因 组 、 蛋 白质 结构 .转录 因子 和 基因 调 
节 , 酶 和 代谢 途径 .突变 和 SNPs, 以 及 文献 和 报道 数据 库 等 。 它 具有 强大 的 搜索 分 
析 功 能 和 方便 易 用 的 界面 。 

2. BLAST 和 FASTA 

在 生物 信息 学 研究 中 , 比 对 是 最 常用 和 最 经 典 的 研究 手段 。 最 常见 的 比 对 是 
蛋白 质 序 列 之 间或 核酸 序列 之 间 的 两 两 比 对 。 对 于 GenBank、SWISS - PROT 等 
序列 数据 库 , 它 们 提供 的 序列 搜索 服务 都 是 以 序列 两 两 比 对 为 基础 的 。 通 常 的 序 
列 搜索 算法 的 不 同 之 处 在 于 搜索 的 速度 和 效率 的 差异 。 而 BLAST 和 FASTA 是 
使 用 最 为 频繁 的 两 种 数据 库 搜索 程序 ,特别 是 较 多 地 用 于 序列 的 比 对 和 同 源 性 检 
索 。 利 用 同 源 性 检索 软件 检索 数据 库 , 可 得 到 与 靶 序 列 具 有 同 源 性 的 序列 ,在 一 定 
程度 上 起 到 核酸 杂交 实验 的 作用 ,因而 也 称 为 电子 杂交 。 

NCBI 的 BLAST 软件 (Basic Local Alignment Search Tool) 由 一 组 功能 不 同 
的 程序 组 成 ,其 中 BLASTN 用 于 在 核酸 序列 库 检索 核酸 序列 ; BLASTP 用 于 在 蛋 
白质 序列 库 中 检索 氨基 酸 序列 ;TBLASTN 则 可 以 在 核酸 序列 中 检索 氨基 酸 序列 。 
BLAST 除 用 于 序列 相似 搜索 外 ,还 可 作为 鉴别 基因 和 遗传 特点 的 手段 。BLAST 
能 够 在 小 于 15s 的 时 间 内 对 整个 DNA 数据 库 执行 序列 搜索 。NCBI 提供 的 附加 
软件 工具 有 :开放 阅读 框 寻觅 器 (ORF Finder) .电子 PCR、 序 列 提交 工具 Sequin 和 
BankIt。 所 有 的 NCBI 数据 库 和 软件 工具 都 可 从 WWW 或 FTP 上 获得 。NCBI 还 
有 E-mail 服务 器 ,提供 用 文本 搜索 或 序列 相似 搜索 访问 数据 库 的 方法 。 

FASTA 是 第 一 个 被 广泛 应 用 的 序列 比 对 和 搜索 工具 包 , 包 含 若干 个 独立 的 
程序 。FASTA 为 了 提供 序列 搜索 的 速度 ,会 先 建立 序列 片段 的 字典 ,查询 序列 先 
在 字典 里 搜索 可 能 的 匹配 序列 ,字典 中 的 序列 长 度 由 ktup 参数 控制 。FASTA 的 
结果 报告 中 会 给 出 每 个 搜索 到 的 序列 与 查询 序列 的 最 佳 比 对 结果 ,以 及 这 个 比 对 
的 统计 学 显著 性 评估 下 值 。FASTA 工具 包 可 以 在 大 多 数 提供 下 载 服 务 的 生物 信 
息 学 站 点 上 找到 。FASTA 可 以 对 同一 序列 使 用 两 种 方法 进行 检索 以 增加 找到 同 
源 序列 的 可 能 性 ,目前 该 软件 已 升级 到 3. 0 版 以 上 。FASTA 与 BLAST 相 比 , 功 
能 相近 ,使 用 方法 也 大 体 相同 ,然而 在 许多 方面 FASTA 有 一 定 改进 ,并 在 严格 的 
统计 学 基础 之 上 修正 了 序列 长 度 对 数据 库 相似 性 得 分 的 影响 。 一 般 地 说 ,BLAST 
对 蛋白 质 序列 的 搜索 较为 有 效 ,FASTA 对 核酸 序列 的 搜索 较为 有 效 。 
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下 面 主要 介绍 BLAST 的 使 用 特点 ,BLAST (http://blast. ncbi. nlm. nih. 
gov/Blast. cgi) 为 现在 应 用 最 广泛 的 序列 相似 性 搜索 工具 , NCBI 提供 了 基于 Web 
的 BLAST 服务 ,用 户 可 以 把 序列 填 人 网 页 上 的 表单 里 ,选择 相应 的 参数 后 提交 到 
数据 服务 器 上 进行 搜索 ,从 电子 邮件 中 获得 序列 搜索 的 结果 。BLAST 包含 五 个 程 
序 和 若干 个 相应 的 数据 库 , 分 别针 对 不 同 的 查询 序列 和 要 搜索 的 数据 库 类 型 ( 见 
表 2-1. 表 2-2、 表 2-3)。 其 中 核酸 库 是 指 搜索 比 对 时 把 核酸 数据 按 密码 子 的 所 
有 可 能 阅读 框架 转换 成 蛋白 质 序 列 。 

表 2-1 BLAST 程序 










































程序 。 | 。 数据库 碍 询 应 用 范围 

Blastp | 蛋白 质 蛋白 质 可 能 找到 具有 远 源 进 化 关系 的 匹配 序列 
Blastn | 核酸 核酸 适合 寻找 分 值 较 高 的 匹配 ,不 适合 远 源 关系 
Blastx | 蛋白质 核酸 (翻译 ) | 适合 新 DNA 序列 和 EST 序列 的 分 析 
tblastn | 核 普 酸 (翻译 | 蛋白 质 适合 寻找 数据 库 中 尚未 标注 的 编码 区 
tblastx | 核酸 (翻译 | 核酸 (翻译 ) | 适合 分 析 EST 序列 





表 2-2 BLAST 的 蛋白 质数 据 库 








数据 库 说 明 
nr 汇集 了 SWISS- PROT, PIR, PRF 以 及 从 GenBank 序列 编码 区 中 得 到 的 
蛋白 质 和 PDB 中 非 元 余 的 蛋白 质 序列 
month nr 中 最 近 30 天 内 的 最 新 序列 
swissprot SWISS - PROT 数据 库 
pdb PDB 结构 数据 库 中 的 蛋白 质 序列 
ycast 酵母 基因 组 中 编码 的 全 部 蛋白 质 
E. coli 大 肠 杆菌 基因 组 中 编码 的 全 部 蛋白 质 
Kabat Kabat 的 免疫 学 相关 蛋白质 序 列 
ACR SWISS- PROT 库 中 的 古老 保守 子 集 
Alu 由 REPBASE 中 的 Alu 重复 序列 翻译 而 来 的 数据 库 





表 2-3 BLAST 的 核酸 数据 库 
数据 库 说 明 





nr 非 元 余 的 GenBank 十 EMBL 十 DDBJ 十 PDB 序列 ,除了 EST、STS、GSS 和 
0, 1, 2 阶段 的 HTGS 序列 








= 


( 续 表 ) 


数据 库 说 明 





求 





month nr 中 最 近 30 天 的 最 新 序列 

dbest 非 宛 余 的 Genbank 十 EMBL 十 DDBJ 十 PDB 的 EST 部 分 
dbsts 非 宛 余 的 Genbank 十 EMBL 十 DDBJ 十 PDB 的 STS 部 分 
htgs 高 产量 基因 组 序列 

yeast 酵母 的 全 基因 组 序列 

E. coli 大 肠 杆菌 的 全 基因 组 序列 

pdb 由 PDB 三 维 结构 库 来 的 核酸 序列 

kabat Kabat 的 免疫 学 相关 序列 库 

vector Genbank 的 载体 子 集 

mito 线粒体 核酸 序列 

alu REPBASE 中 挑选 的 Alu 序列 

Bss 基因 组 勘测 序列 (Genome Survey Sequence) 


在 BLAST 页 面 上 还 有 一 些 特殊 的 BLAST 搜索 可 供 选 择 , 以 满足 专门 的 需 


如 GEO、SNPs 等 ,具体 如 下 所 示 : 


® Make specific primers with Primer-BLAST 

Search trace archives 

Find conserved domains in your sequence (cds) 

Find sequences with similar conserved domain architecture (cdart) 
Search sequences that have gene expression profiles (GEO) 
Search immunoglobulins (IgBLAST) 

Search for SNPs (snp) 

Screen sequence for vector contamination (vecscreen) 

Align two (or more) sequences using BLAST (bl2seq) 

Search protein or nucleotide targets in PubChem BioAssay 

Search SRA transcript and genomic libraries 

Constraint Based Protein Multiple Alignment Tool 
Needleman-Wunsch Global Sequence Alignment Tool 

Search RefSeqGene 

Search WGS sequences grouped by organism 

BLAST 对 序列 格式 的 要 求 是 常见 的 FASTA 格式 。FASTA 格式 的 第 一 行 是 


描述 行 ,第 一 个 字符 必须 是 “〉” 字 符 ; 随 后 的 行 是 序列 本 身 , 一 般 每 行 序列 不 要 超过 
80 个 字符 ,序列 中 可 包含 回 车 符 。 序 列 由 标准 的 IUB/IUPAC 氨基 酸 和 核酸 代码 
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代表 ;小 写字 符 会 全 部 转换 成 大 写 ; 单 个 “一 ”号 代表 不 明 长 度 的 空位 ;在 氨基 酸 序 
列 里 允许 出 现 “U” 和 “x ”号 ;任何 数字 都 应 被 去 掉 或 换 成 字母 (如 不 明 核 酸 用 “N”， 
不 明 氨 基 酸 用 “X”)。 

对 于 核酸 序列 ,除了 A、C、G、T、U 分 别 代表 各 种 核酸 之 外 ,R 代表 G 或 
A( 味 叭 );*Y 代表 工 或 C( 喀 啶 );K 代表 G 或 工 ( 带 酮 基 );M 代表 A 或 C( 带 氨基 ); 
S 代 表 G 或 C( 强 );W 代表 人 A 或 T( 弱 );B 代 表 G、T 或 C;D 代 表 G、A 或 T; 
HH 代表 A、C 或 T;V 代表 G、C 或 A;N 代表 A、G、C, 工 中 任意 一 种 。 对 于 氨基 
酸 序列 ,除了 20 种 常见 氨基 酸 的 标准 单字 符 标 识 之 外 ,B 代表 Asp 或 Asn;U 代表 
硒 代 半 胱 氨 酸 ;Z 代表 Glu 或 Gln;X 代表 任意 氨基 酸 ; * ”为 翻译 结束 标志 。 

从 1998 年 起 ,BLAST 的 版 本 为 2. 0, 其 内 容 的 一 个 变化 是 位 点 特异 性 反复 
(Position Specific Iterated)BLAST(PSI- BLAST) ,目前 版 本 为 BLAST 2. 2. 27。 
PSI- BLAST 的 特色 是 每 次 用 profile 搜索 数据 库 后 再 利用 搜索 的 结果 重新 构建 
profile, 然 后 用 新 的 profile 再 次 搜索 数据 库 , 如 此 反复 直至 没有 新 的 结果 产生 为 
止 , 即 在 数学 上 一 直 和 迭代 直到 收敛 或 运算 至 预先 设 定 的 次 数 为 止 。PSI - BLAST 
先 用 带 空位 的 BLAST 搜索 数据 库 , 将 获得 的 序列 通过 多 序列 比 对 来 构建 第 一 个 
profile。PSI- BLAST 自然 地 拓展 了 BLAST 方法 ,能 寻找 蛋白 质 序列 中 的 隐 含 模 
式 , 研 究 表 明 这 种 方法 可 以 有 效 地 找到 很 多 序列 差异 较 大 而 结构 功能 相似 的 相关 
蛋白 ,甚至 可 以 与 一 些 结构 比较 。PSI - BLAST 服务 可 以 在 NCBI 的 BLAST 主页 
上 得 到 ,还 可 以 从 NCBI 的 FTP 服务 器 上 下 载 PSI- BLAST 的 独立 程序 。 

现在 还 有 许多 未 知 序列 分 析 软 件 。 随 着 各 种 组 学 研究 的 开展 ,争夺 有 限 基因 
资源 的 竞争 日 益 激烈 。 利 用 网 上 软件 分 析 未 知 序列 ,迅速 得 到 尽 可 能 多 的 信息 显 
得 尤为 重要 。 因 此 这 些 软 件 的 发 展 非常 迫切 。 

其 他 相关 的 常用 软件 有 如 DNA 序列 酶 切 位 点 分 析 的 软件 .PCR 引物 设计 软 
件 \ 凝 胶 图 谱 、 基 因 指 纹 识别 分 析 的 软件 、 蛋 白质 性 质 预 测 软件 、 蛋 白质 结构 预测 软 
件 、 蛋 白质 家 族 鉴 定 软件 、 分 子 结构 视 化 软件 、 遗 传 分 析 软 件 等 等 。 

















第 四 节 ”有 蛋白质 和 核酸 的 结构 与 功能 的 预测 分 析 


人 们 获得 各 种 核酸 和 蛋白 质 序列 的 目的 是 了 解 这 些 序列 在 生物 体 中 充当 了 怎 
样 的 角色 。 在 后 基因 时 代 , 生 物 信息 学 家 面 对 的 不 仅 是 序列 和 基因 ,而 是 越 来 越 多 
的 完整 基因 组 。 人 们 想 知道 ,最 小 独立 生活 的 生物 至 少 需要 多 少 基因 ? 生物 的 起 
源 是 什么 ? 不 同 物种 之 间 基 因 组 差异 是 什么 ? 基因 组 差异 和 物种 差异 之 间 的 关系 
是 什么 ? 因此 ,由 完整 基因 组 研究 所 导致 的 比较 基因 组 学 必 将 成 为 新 的 研究 领域 。 


< 


另 一 方面 ,蛋白 质 分 子 是 由 20 种 不 同 的 氨基 酸 通过 共 价 键 连接 而 成 的 线性 多 
肽 链 ,每 一 种 蛋白 质 在 天 然 条 件 下 都 有 自己 特定 的 空间 结构 ,以 一 定 氨 基 酸 顺序 排 
列 的 多 肽 链 是 如 何 形成 有 一 定 空 间 结 构 的 蛋白 质 分 子 的 ,这 就 是 对 蛋白 质 结 构 的 
预测 。 





生物 功能 的 主要 体现 者 是 蛋白 质 , 蛋 白质 的 修饰 加 工 、 转 运 定位 、 结 构 变化 、 相 
互 作用 等 活动 ,仅仅 从 基因 的 角度 来 研究 是 不 够 的 。 蛋 白质 是 基因 组 的 蛋白 质 产 
物 ,目前 主要 通过 二 维 凝 胶 电泳 和 测序 质谱 技术 来 研究 。 无 论 是 生物 芯片 还 是 蛋 
白质 组 技术 的 发 展 ,都 更 强烈 地 依赖 于 生物 信息 学 的 理论 与 工具 。 

在 分 子 水 平 对 基因 表达 调控 的 研究 方面 ,存在 许多 热点 问题 。 这 其 中 有 ,基因 
是 如 何 来 产生 DNA 和 蛋白 质 的 信息 的 ? 例如 DNA 信息 有 :DNA 序列 中 重复 片 
段 .编码 区 ,启动 子 ,内 含 子 /外 显 子 ,转录 调控 因子 结合 位 点 等 :蛋白质 信息 有 :和 蛋 
白质 中 相对 分 子 质 量 、 等 电 点 二 级 结构 \ 三 级 结构 、 四 级 结构 , 膜 蛋 白 的 跨 膜 区 段 、 
酶 的 活性 位 点 ,以 及 蛋白 质 之 间 相互 作用 等 结构 和 功能 信息 。 如 调节 蛋白 是 如 何 
作用 于 它 的 顺 式 调控 元 件 启动 子 或 增强 子 ,是 被 什么 调整 的 ? 虽然 采用 实验 的 方 
法 是 多 年 以 来 解决 这 类 问题 的 主要 途径 ,但 新 的 思路 是 利用 已 有 的 对 生物 大 分 子 
结构 和 功能 特性 的 认识 ,用 生物 信息 学 的 方法 通过 计算 机 模拟 和 计算 来 预测 这 些 
信息 或 提供 与 之 相关 的 辅助 信息 。 由 于 生物 信息 学 的 特点 ,可 以 用 较 低 的 成 本 在 
较 短 的 时 间 获 得 可 靠 的 结果 。 近 10 年 来 生物 学 数据 的 剧 增 大 大 促进 了 各 种 序列 
分 析 和 预测 技术 的 发 展 , 目 前 已 经 可 以 用 理论 预测 的 方法 获得 大 量 的 结构 和 功能 
信息 。 但 是 要 注意 的 是 ,尽管 各 种 预测 方法 都 基于 现 有 的 生物 学 数据 和 已 有 的 生 
物 学 知识 ,但 在 不 同 模型 或 算法 基础 上 建立 的 不 同 分 析 程序 ,有 其 各 自 一 定 的 适用 
范围 和 相应 的 限制 条 件 , 不 同 的 方法 可 能 得 到 不 同 的 结果 。 因 此 最 好 对 同一 个 生 
物 学 问题 尽 可 能 采用 多 种 分 析 程序 处 理 ,综合 分 析 各 种 方法 得 到 的 结果 及 其 可 靠 
性 。 此 外 ,生物 信息 学 的 分 析 只 是 为 生命 科学 的 研究 提供 参考 ,这 些 信 息 能 够 提高 
研究 的 效率 或 提供 研究 的 思路 ,但 很 多 问题 还 必须 通过 实验 的 方法 进行 验证 。 


一 、 核 酸 的 序列 预测 方法 


核酸 的 序列 预测 就 是 在 核酸 序列 中 寻找 基因 , 找 出 基因 的 位 置 和 功能 位 点 的 
位 置 ,以 及 标记 已 知 的 序列 模式 等 的 过 程 。 核 酸 序列 预测 中 ,确认 一 段 DNA 序列 
是 一 个 基因 需要 有 多 个 证 据 的 支持 。 一 般 确定 基因 的 位 置 和 结构 需要 多 个 方法 综 
合 运用 ,而 且 要 遵循 一 定 的 规则 :对 于 真 核 生 物 序列 ,在 进行 预测 之 前 先 要 进行 重 
复 序列 分 析 , 把 散布 的 重复 序列 标记 出 来 并 除去 ;选用 预测 程序 时 要 注意 程序 的 物 
种 特异 性 ,要 弄 清 程 序 适用 的 是 基因 组 序列 还 是 cDNA 序列 ;很 多 程序 对 序列 长 度 
也 有 要 求 ,有 的 程序 只 适用 于 长 序列 。 
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在 重复 片段 频繁 出 现 的 区 域 里 ,基因 编码 区 和 调控 区 不 太 可 能 出 现 ;如 果 某 段 
DNA 片段 的 假想 产物 与 某 个 已 知 的 蛋白 质 或 其 他 基因 的 产物 具有 较 高 序列 相似 
性 的 话 ,那么 这 个 DNA 片段 就 非常 可 能 属于 外 显 子 片段 ;在 一 段 DNA 序列 上 出 
现 统计 上 的 规律 性 , 即 所 谓 的 “密码 子 偏好 性 ”, 则 说 明 这 段 DNA 和 和 蛋白质 编 码 区 
有 关 ; 其 他 的 蛋白 质 编码 区 依据 包括 与 “模板 ”序列 模式 或 简单 序列 模式 是 否 匹 
配 等 。 

1. 重复 序列 分 析 

对 于 简单 重复 序列 的 分 析 处 理 , 程 序 有 CENSOR 和 RepeatMasker 等 ,可 以 在 
Web 界面 上 使 用 这 些 程序 。 如 果 有 大 量 序列 需要 处 理 , 可 以 使 用 XBLAST 程序 。 
XBLAST 中 包含 了 由 程序 作者 收集 整理 的 一 些 Alu 序列 ,在 Repbase 中 还 能 找到 
更 多 的 重复 序列 。 还 可 以 把 克隆 载体 也 加 入 重复 序列 中 ,这 样 就 可 以 在 处 理 重复 
序列 时 顺便 把 克隆 载体 也 一 同 除去 。 经 处 理 的 序列 中 重复 序列 所 在 位 置 会 一 律 由 
“X" 人 代替。 对 于 真 核 生 物 的 核酸 序列 而 言 ,在 进行 基因 辨识 之 前 都 应 该 把 重复 序 
列 标 记 出 来 并 除去 ,因为 很 多 情况 下 重复 序列 会 严重 干扰 预测 程序 ,尤其 是 会 扰乱 
涉及 数据 库 搜 索 的 程序 。 

2. 数据 库 搜索 

把 未 知 核酸 序列 作为 查询 序列 ,通过 比 对 在 数据 库 里 搜索 与 之 相似 的 已 有 序 
列 是 序列 分 析 预 测 的 有 效 手段 。 值 得 注意 的 是 ,由 相似 性 分 析 做 出 的 结论 可 能 导 
致 错误 ,有 一 定 比 例 的 序列 很 难 在 数据 库 里 找到 合适 的 同 源 体 ,目前 只 有 一 半 的 新 
蛋白 质 能 在 已 有 数据 库 中 找到 同 源 体 。 但 对 于 EST 序列 而 言 ,序列 搜索 是 非常 有 
效 的 预测 手段 。 

3. 编码 区 统计 特性 分 析 

将 密码 子 出 现 的 频率 统计 后 ,可 发 现 DNA 中 密码 子 的 使 用 频率 不 是 平均 分 
布 的 , 某 些 密码 子 会 以 较 高 的 频率 使 用 ,而 另 一 些 则 较 少 出 现 ,从 而 编码 区 的 序列 
呈现 出 一 定 的 统计 特异 性 , 即 所 谓 的 “密码 子 偏好 性 ”。 利 用 这 一 特性 对 未 知 序列 
进行 统计 学 分 析 可 以 发 现 编码 区 的 粗略 位 置 。 这 一 类 技术 包括 : 双 密 码 子 计数 ( 统 
计 连 续 两 个 密码 子 的 出 现 频率 ); 核 苷 酸 周 期 性 分 析 ( 分 析 同 一 个 核 苷 酸 在 相距 3， 
6,，9, …bp 的 位 置 上 周期 性 出 现 的 趋势 和 规律 ) ;均一 性 对 复杂 性 的 测量 分 析 ( 如 
长 同 聚 区 段 的 统计 计数 ); 开 放 可 读 框 架 分 析 等 。 

常见 的 编码 区 统计 特性 分 析 工 具 将 多 种 统计 分 析 技术 组 合 起 来 ,给 出 对 编码 
区 的 综合 判别 。 著 名 的 程序 有 GRAIL 和 GenMark 等 。 必 须 注意 ,许多 相关 程序 
只 适用 于 专门 物种 。 

4. 非 编 码 区 中 DNA 功能 性 位 点 分 析 

在 细菌 中 非 编码 区 只 占 整个 基因 组 序列 的 10% 到 20%。 而 高 等 生物 和 人 的 


= 


基因 组 中 非 编码 区 都 占 到 基因 组 序列 的 绝 大 部 分 。 从 生物 进化 的 观点 看 来 , 随 着 
生物 体 功能 的 完善 和 复杂 化 , 非 编 码 区 序列 有 明显 增加 的 趋势 ,表明 这 部 分 序列 必 
定 具 有 重要 的 生物 功能 。 普 遍 的 认识 是 ,它们 与 基因 在 四 维 时 空 的 表达 调控 有 关 。 
因此 寻找 这 些 区 域 的 编码 特征 以 及 信息 调节 与 表达 规律 是 非常 重要 的 。 

启动 子 是 基因 表达 所 必需 的 重要 序列 信号 ,识别 启动 子 对 于 基因 辨识 十 分 重 
要 。 有 一 些 程序 根据 实验 获得 的 转录 因子 结合 特性 来 描述 启动 子 的 序列 特征 ,并 
依次 作为 启动 子 预测 的 依据 ,但 实际 效果 并 不 十 分 理想 ,遗漏 和 假 阳性 问题 都 比较 
严重 。 总 的 来 说 ,启动 子 仍 是 研究 探索 的 难题 。 

内 含 子 / 外 显 子 剪接 位 点 一 般 具 有 较 明显 的 序列 特征 。 要 注意 可 变 剪 接 的 问 
题 ,由 于 可 变 剪接 在 数据 库 里 的 注释 非常 不 完整 ,因此 很 难 评估 剪接 位 点 识别 程序 
预测 剪接 位 点 的 敏感 性 和 精度 。 如 果 把 剪接 位 点 和 两 侧 的 编码 特性 结合 起 来 分 
析 , 则 有 助 于 提供 剪接 位 点 的 识别 效果 。 常 见 的 基因 识别 工具 很 多 都 包含 了 剪接 
位 点 识别 功能 ,如 GENSCAN, 独 立 的 剪接 位 点 识别 工具 有 NetGene 等 。 

翻译 起 始 位 点 同 终止 信号 的 识别 和 定位 同样 重要 。 对 于 真 核 生物 ,如 果 已 知 
转录 起 始点 ,并 且 没 有 内 含 子 打 断 5' 非 翻译 区 ,那么 “Kozak 规则 ”可 以 在 大 多 数 情 
况 下 定位 起 始 密码 子 。 原 核 生物 一 般 没 有 剪接 过 程 ,在 开放 阅读 框 中 找 出 正确 的 
起 始 密码 子 仍 很 困难 。 由 于 多 顺 反 操纵 子 的 存在 ,原核 生物 的 启动 子 定位 不 像 在 
真 核 生物 中 起 关键 作用 。 对 于 原核 生物 , 关键 是 核糖 体 结合 点 的 定位 。PolyA 和 
翻译 终止 信号 不 像 起 始 信号 那么 重要 ,但 也 可 以 辅助 划分 基因 的 范围 。 

常用 的 启动 子 识别 程序 有 FunSiteP、PROMOTER SCAN、PromDF 等 。 

5. tRNA 基因 识别 

tRNA 基因 识别 比 编码 蛋白 质 的 基因 识别 简单 ,目前 基本 已 经 解决 了 用 理论 
方法 预测 tRNA 基因 的 问题 。 采 用 tRNAscan-SE 工具 ,可 通过 分 析 启 动 子 元 件 的 
保守 序列 模式 .tRNA 二 级 结构 的 分 析 、 转 录 控 制 元 件 分 析 和 除去 绝 大 多 数 假 阳 性 
的 筛选 过 程 ,能 识别 真 tRNA 基因 , 据 称 识别 率 达 到 99%。Pol3Scan 也 可 以 用 于 
寻找 tRNA。 

6. 其 他 基因 预测 工具 

在 基因 预测 中 还 有 许多 应 用 程序 或 工具 。 它 们 大 多 把 各 个 方面 的 分 析 综 合 起 
来 ,对 DNA 序列 中 与 基因 有 关 的 各 种 特性 进行 整体 的 分 析 和 预测 , 如 
MatInspector、TRADAT、PatSearch、NIX、SaGa 等 。 多 种 信息 的 综合 分 析 有 助 
于 提高 预测 的 可 靠 性 ,但 也 有 一 些 局 限 性 。 如 物种 适用 范围 ,序列 长 度 要 求 等 具有 
局 限 性 ;对 多 基因 或 部 分 基因 ,有 时 候 所 预测 的 基因 结构 可 靠 性 较 差 ; 所 发 现 基因 
的 预测 精度 比较 低 , 分 析 时 对 序列 中 的 错误 很 敏感 ;对 于 识别 可 变 剪接 .重合 基因 
和 启动 子 等 复杂 基因 的 效果 不 显著 。 
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二 、 有 蛋白 质 的 序列 、 结 构 和 功能 的 预测 方法 


传统 的 生物 学 认为 ,蛋白 质 的 序列 决定 了 它 的 三 维 结构 ,也 就 决定 了 它 的 功 
能 。 由 于 用 X 光 晶体 衍射 . 圆 二 色谱 和 NMR 核磁 共振 技术 测定 蛋白 质 的 三 维 结 
构 ,以 及 用 生化 方法 研究 蛋白 质 的 功能 效率 仍然 不 高 ,无 法 适应 蛋白 质 序列 数量 飞 
速 增长 的 需要 ,因此 近 几 十 年 来 许多 科学 家 致力 于 研究 用 理论 计算 的 方法 预测 蛋 
白质 的 三 维 结构 和 功能 ,经 过 多 年 努力 取得 了 一 定 的 成 果 。 

蛋白 质 结构 预测 的 目的 是 利用 已 知 的 一 级 序列 来 构建 蛋白 质 的 立体 结构 模 
型 ,对 蛋白 质 进行 结构 预测 相当 复杂 ,在 不 同 的 已 知 条 件 下 对 于 不 同 的 蛋白 质 采取 
不 同 的 策略 ,目前 预测 蛋白 质 空 间 结 构 的 方法 可 以 分 为 以 下 两 大 类 : 

1. 分 子 动 力学 方法 

这 类 方法 采用 分 子 力学 、 分 子 动力 学 的 方法 ,根据 物理 化 学 的 基本 原理 及 热力 
学 假定 :一 个 蛋白 质 分 子 在 溶液 中 的 天 然 构象 相对 应 于 热力 学 上 最 稳定 、 自 由 能 最 
低 的 存在 状态 ,从 理论 上 计算 蛋白 质 分 子 的 空间 结构 。 但 这 一 方法 目前 存在 着 三 
个 主要 问题 :首先 ,用 以 描述 蛋白 质 -溶剂 系统 工程 力 场 和 能 量 函 数 还 处 于 灶 定 量 
阶段 ;其 次 ,数学 上 还 没有 有 效 方法 解决 能 量 极 小 化 问题 ;第 三 ,目前 并 没有 证 据 证 
明 蛋 白质 的 天 然 构象 就 是 其 自由 能 最 小 的 构象 。 

2. 基于 知识 的 预测 方法 

这 类 方法 通过 对 已 知 空间 结构 的 蛋白 质 进行 研究 和 分 析 , 找 出 蛋白 质 一 级 
结构 和 空间 之 间 的 联系 ,总 结 一 定 的 规律 并 建立 一 些 经 验 规则 。 目 前 它 已 经 被 
成 功 地 应 用 于 同 源 蛋 白质 空间 结构 预测 的 研究 。 然 而 对 于 同 源 性 低 的 和 非 同 源 
蛋白 质 分 子 来 说 ,由 于 受 二 级 结构 预测 精度 的 限制 ,这 种 方法 的 预测 效果 有 局 
限 性 。 

通过 对 大 量 已 知 空间 结构 的 蛋白 质 分 子 的 研究 和 分 析 发 现 ,一 条 多 肽 链 可 能 
采取 的 构象 的 数目 是 相当 大 的 ,在 蛋白 质 分 子 中 由 二 级 结构 预测 是 解决 从 蛋白 质 
的 一 级 结构 预测 其 空间 结构 问题 的 关键 步骤 。 现 有 的 预测 方法 都 假定 蛋白 质 的 二 
级 结构 主要 由 邻近 残 基 的 短程 相互 作用 所 决定 的 ,然后 通过 对 一 些 已 知 空间 结构 
的 蛋白 质 分 子 进行 分 析 、 归 纳 , 制 定 一 套 预测 规则 并 根据 这 些 规 则 对 其 他 已 知 或 未 
知 结构 的 蛋白 质 分 子 的 二 级 结构 进行 预测 。 目 前 常用 的 方法 有 :基于 单 残 基 统计 
的 Chou - Fasman 方法 ,基于 信息 论 和 统计 的 Garnier 方法 、Lim 方法 ,人 工 神经 网 
络 方法 等 。 检 验 结果 显示 ,上 述 几 种 方法 的 预测 准确 率 分 别 为 50%、56%、59% 
和 64%, 而 现在 一 般 认为 二 级 结构 的 预测 准确 率 如 果 达 到 80% 的 话 ,就 可 以 基本 
准确 地 预测 一 个 蛋白 质 分 子 的 三 维 空间 结构 ,因此 必须 进一步 提高 蛋白 质 二 级 结 
构 的 预测 精度 。 
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具体 的 常用 蛋白 质 预测 分 析 方法 有 以 下 几 种 : 

1) 基于 氨基酸 组 成 的 蛋白 质 辨识 

根据 蛋白 质 的 20 种 氨基 酸 组 成 ,许多 程序 可 用 于 辨识 未 知 蛋 白质 。 如 
AACompIdent 程序 ,在 应 用 时 需要 预先 提供 一 些 信息 ,包括 氨基 酸 组 成 蛋白 质 的 
名 称 、pI 和 Mw( 如 果 已 知 的话 ) 以 及 它们 的 估算 误差 ,所 属 物 种 种 类 、 标 准 蛋白 质 
的 氨基 酸 组 成 .标准 蛋白 质 的 SWISS - PROT 编号 等 。 这 个 程序 在 SWISS - 
PROT 和 TrEMBL 数据 库 中 搜索 组 成 相似 的 蛋白 质 。AACompSim(ExPASy) 程 
序 与 前 者 类 似 ,但 以 SWISS - PROT 蛋白 质 序列 为 依据 进行 比较 , 它 可 以 用 于 发 现 
蛋白 质 之 间 较 弱 的 相似 关系 ,相似 程度 低 于 25%。 

PROPSEARCH 也 提供 基于 氨基 酸 组 成 的 蛋白 质 辨识 功能 ,检测 蛋白 质 之 间 
的 微弱 关系 。 程 序 作 者 用 144 种 不 同 的 物化 性 质 来 分 析 蛋 白质 ,包括 相对 分 子 质 
量 ` 巨 大 残 基 的 含量 ,平均 朴 水 性 ,平均 电荷 等 ,把 查询 序列 的 这 些 属性 构成 的 “ 查 
询 向 量 ” 与 SWISS - PROT 和 PIR 中 预先 计算 好 的 各 个 已 知 蛋 白质 的 “属性 向 量 ” 
进行 比较 。 这 个 程序 能 有 效 地 发 现 同一 蛋白 质 家 族 的 成 员 。 

2) 基于 蛋白 质 序列 预测 蛋白 质 的 物理 性 质 

从 蛋白 质 序列 出 发 ,可 以 预测 出 蛋白 质 的 许多 物理 性 质 , 包 括 等 电 点 、 相 对 分 
子 质量 , 酶 切 特性 、 朴 水 性 ,电荷 分 布 等 。 相 关 工具 有 以 下 几 种 。 

Compute pl/MW: 它 是 ExPASy 工具 包 中 的 程序 ,用 于 计算 蛋白 质 的 等 电 点 
和 分 子 量 。 但 对 于 碱 性 蛋白 质 , 计 算出 的 等 电 点 可 能 不 准确 。 

PeptideMass: 它 也 是 ExPASy 工具 包 中 的 程序 ,可 用 于 分 析 蛋 白质 在 各 种 蛋 
和 白 酶 和 化 学 试剂 处 理 后 的 内 切 产物 。 和 蛋白酶 和 化 学 试剂 包括 胰 和 蛋白酶. 麻 蛋白 酶 、 
LysC 省 化 氰 .ArgC、AspN 和 GluC 等 。 

TGREASE: 它 是 属于 FASTA 工具 包 中 的 程序 ,可 用 于 分 析 蛋 白质 序列 的 蚊 
水 性 。 这 个 程序 依赖 于 朴 水 性 的 衡量 尺度 , 沿 蛋白 质 序列 计算 每 个 残 基 位 点 的 平 
均 玻 水 性 ,并 给 出 疏水 性 -序列 曲线 ,用 这 个 程序 可 以 发 现 膜 蛋白 的 跨 膜 区 和 高 疏 
水 性 区 的 明显 相关 性 。 

SAPS: 它 是 蛋白 质 序列 统计 分 析 , 对 提交 的 序列 给 出 大 量 蛋 白质 的 物理 和 化 
学 性 质 的 分 析 数 据 , 包 括 氨基 酸 组 成 统计 .电荷 分 布 分 析 、. 电 荷 聚集 区 域 ,高 度 疏 水 
区 域 . 跨 膜 区 段 .重复 结构 等 。 

3) 蛋白 质 二 级 结构 预测 

蛋白 质 二 级 结构 是 指 a 螺旋 和 8 折 释 等 规则 的 蛋白 质 局 部 结构 元 件 。 不 同 的 
氨基 酸 残 基 对 于 形成 不 同 的 二 级 结构 元 件 具 有 不 同 的 倾向 性 。 按 蛋白 质 中 二 级 结 
构 的 成 分 ,可 以 把 球形 蛋白 分 为 全 蛋白 .全 B 蛋 白 .a 十 8 蛋白 和 ao/8B 和 蛋白 等 四 个 
折 释 类 型 。 预 测 蛋白 质 二 级 结构 的 算法 大 多 以 已 知 三 维 结构 和 二 级 结构 的 蛋白 质 
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为 依据 ,采用 神经 网 络 技术 .遗传 算法 等 构建 预测 方法 。 还 有 将 多 种 预测 方法 结合 
起 来 ,获得 “一 致 序列 ”。 二 级 结构 预测 ,一 般 对 于 a 螺旋 的 预测 精度 较 高 ,对 B 折 
全 的 预测 差 些 ,而 对 除 a 螺旋 和 8 折 释 等 之 外 的 无 规则 二 级 结构 则 效果 很 差 。 具 
体 方法 有 : 

nnPredict: 它 用 神经 网 络 方法 预测 二 级 结构 ,蛋白 质 结构 类 型 分 为 全 a 蛋白 、 
全 8 蛋白 和 a/8B 蛋白 ,输出 结果 包括 “H”(a 螺旋 )“E?(B 折 肥 ) 和 “一 ”( 转 角 )。 这 
个 方法 对 全 a 蛋白 能 达到 79% 的 准确 率 。 

PredictProtein: 它 提供 序列 搜索 和 结构 预测 服务 。 它 先 在 SWISS - PROT 中 
搜索 相似 序列 ,用 MaxHom 算法 构建 多 序列 比 对 的 profile, 再 在 数据 库 中 搜索 相 
似 的 profile, 然 后 用 一 套 PHD 程序 来 预测 相应 的 结构 特征 。 二 级 结构 预测 包括 二 
级 结构 类 型 ,还 包含 每 个 残 基 位 点 的 预测 可 信 度 。 这 个 方法 的 平均 预测 准确 率 达 
到 72%。 

SOPMA: 它 是 带 比 对 的 自 优 化 预测 方法 ,将 几 种 独立 二 级 结构 预测 方法 汇集 
成 “一 致 预测 结果 ”, 所 采用 的 二 级 结构 预测 方法 包括 GOR 方法 、Levin 同 源 预 测 
方法 ,双重 预测 方法 .PHD 方 法 和 SOPMA 方法 。 多 种 方法 的 综合 应 用 平均 效果 
优 于 单个 方法 。 

4) 其 他 特殊 局 部 结构 

其 他 特殊 局 部 结构 包括 膜 蛋 白质 的 跨 膜 区 、 信 号 肽 ,卷曲 螺旋 (Coiled Coils) 
等 ,具有 明显 的 序列 特征 和 结构 特征 ,也 可 以 用 计算 方法 加 以 预测 ,如 以 下 程序 。 

COILS: 它 是 关于 两 条 螺旋 形成 的 卷曲 螺旋 预测 方法 ,将 序列 与 已 知 的 平行 
双 链 卷曲 螺旋 数据 库 进行 比较 ,得 到 相似 性 分 数 ,并 据 此 算出 序列 形成 卷曲 螺旋 的 
概率 。 

TMpred: 它 根据 来 自 SWISS - PROT 的 跨 膜 蛋白 质数 据 库 Tmbase, 预测 蛋 
白质 的 跨 膜 区 段 和 在 膜 上 的 取向 。 利 用 跨 膜 结构 区 段 的 数量 、 位 置 以 及 侧 咽 序列 ， 
通过 加 权 打 分 进行 预测 。 

TMAP: 它 可 提供 预测 蛋白 质 序列 中 跨 膜 螺 旋 的 服务 。 

SignalP: 它 是 基于 神经 网 络 方法 预测 蛋白 质 序列 中 分 泌 型 信号 肽 及 其 前 切 位 
点 进行 预测 的 。 

5) 蛋白 质 的 三 维 结构 

蛋白 质 三 维 结构 预测 是 最 复杂 和 最 困难 的 预测 技术 。 研 究 发 现 ,序列 差异 较 
大 的 蛋白 质 序列 也 可 能 折 又 成 类 似 的 三 维 构象 , 自然 界 里 的 蛋白 质 结构 的 多 样 性 
远 少 于 蛋白 质 序列 的 多 样 性 ,因此 有 关 和 蛋白 质 的 折 羡 问题 还 有 待 于 研究 。 

预测 蛋白 质 三 维 结构 的 最 常见 策略 是 “ 同 源 建 模 ”和 “Threading” 方 法 。 
Threading 方法 或 折 秋 类 型 识别 方法 的 基本 思想 是 假定 被 预测 蛋白 质 的 折 伙 类 型 
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与 菜 一 已 知 结构 的 蛋白 质 的 折 又 类 型 相同 ,这 样 ,蛋白 质 结构 预测 的 问题 就 转变 为 
在 已 知 空间 结构 的 蛋白 质 中 ,选取 一 种 被 预测 序列 最 可 能 采取 的 折 普 类 型 ,从 而 大 
大 减少 了 预测 蛋白 质 结构 的 难度 ,这 一 方法 已 经 成 功 地 预测 了 一 些 蛋 白质 的 空间 
结构 。 

同 源 建 模 方法 是 先 在 蛋白 质 结构 数据 库 中 寻找 未 知 结构 蛋白 的 同 源 伙伴 ,再 
利用 一 定 计算 方法 把 同 源 蛋 白 的 结构 优化 构建 出 预测 的 结果 。 具 体 的 方法 如 
SWISS - MODEL( 自 动 蛋白 质 同 源 建 模 服务 器 ), 它 有 两 个 工作 模式 :第 一 趋向 模 
式 (First Approach mode) 和 优化 模式 (Optimise mode)。 程 序 先 把 提交 的 序列 在 
ExPdb 晶体 图 像 数据 库 中 搜索 相似 性 足够 高 的 同 源 序列 ,建立 最 初 的 原子 模型 ,再 
对 这 个 模型 进行 优化 ,产生 预测 的 结构 模型 。CPHmodels 也 是 利用 神经 网 络 进行 
同 源 建 模 预 测 蛋 白质 结构 的 方法 。 

除 此 之 外 ,用 PSI - BLAST 方法 也 可 以 把 查询 序列 分 配 到 合适 的 蛋白 质 折 巧 
家 族 。 

6) 蛋白 质 的 空间 结构 模拟 

蛋白 质 分 子 模拟 与 蛋白 质 结构 预测 的 方法 主要 有 蛋白 质 分 子 模型 的 建立 与 显 
示 。 分 子 模拟 技术 是 利用 计算 机 建立 原子 水 平 的 分 子 模型 来 模拟 分 子 的 结构 与 行 
为 ,进而 模拟 分 子 体系 的 各 种 物理 与 化 学 性 质 。 利 用 分 子 模拟 技术 结合 计算 机 图 
形 技术 可 以 更 形象 .更 直观 地 研究 蛋白 质 等 生物 大 分 子 的 结构 ,蛋白 质 空 间 结构 的 
清晰 表述 对 揭示 蛋白 质 的 结构 和 功能 之 间 的 关系 、 总 结 蛋 白质 结构 的 规律 预测 蛋 
白质 肽 链 折 伙 和 蛋白 质 结构 等 ,都 是 强 有 力 的 帮助 和 促进 。 

当前 分 子 模拟 技术 主要 借助 先进 的 计算 机 图 形 工作 站 ,通过 友好 的 图 形 环境 ， 
使 用 者 可 利用 鼠标 极为 方便 地 建立 多 肽 、 蛋 白 分 子 的 初始 模型 。 同 时 ,也 可 以 对 已 
经 被 测定 的 生物 大 分 子 的 三 维 结构 进行 显示 ,并 对 这 些 结构 进行 灵活 方便 的 平移 、 
旋转 .放大 及 缩小 等 操作 ,分 子 模型 的 建立 为 下 一 步 进行 的 分 子 模拟 以 及 了 解 结构 
与 功能 的 关系 打下 基础 。 

RasMol 可 以 建立 抽象 分 子 的 立体 结构 ,通过 生动 的 颜色 及 模型 ,对 一 些 复杂 
的 蛋白 ,核酸 、 生 物 大 分 子 等 以 互动 的 形式 ,从 不 同 的 角度 予以 展现 ,以 了 解 其 结构 
和 活性 区 域 。 - 

InsightII 三 维 图 形 环境 软件 包 集 成 了 从 生物 分 子 结构 功能 研究 到 基于 靶 点 药 
物 设计 的 全 套 工具 。InsightII 在 揭示 蛋白 质 结构 功能 关系 、 生 物 分 子 结构 模拟 与 
动力 学 计算 、 基 于 靶 点 药物 设计 .抗体 设 计 、 酶 工程 .生物 分 子 间 的 相互 作用 (包括 
蛋白 质 与 蛋白 质 、 蛋 白质 与 肽 、 蛋 白质 与 核酸 、 蛋 白质 与 有 机 小 分 子 )、 生 物 分 子 核 
磁 共 振 、 功 能 基因 组 以 及 蛋白 质 组 等 方面 有 着 广泛 的 应 用 。 

近年 来 ,国际 上 还 发 展 了 一 些 从 蛋白 质 的 一 级 结构 直接 预测 蛋白 质 空间 结构 
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的 新 方法 。 这 些 方 法 的 基本 思想 是 将 基于 知识 的 预测 方法 与 计算 化 学 ,统计 物理 
学 的 方法 相 结合 ,采用 简化 的 蛋白 质 模型 和 根据 已 知 结构 的 蛋白 质 所 导出 的 平均 
势 场 ,从 理论 上 计算 蛋白 质 的 空间 结构 。 这 些 方法 不 仅 可 以 从 蛋白 质 的 一 级 结构 
直接 预测 蛋白 质 的 三 维 结构 ,而 且 可 以 在 计算 机 上 模拟 蛋白 质 分 子 折 释 的 全 过 程 。 
目前 ,还 有 一 些 新 方法 在 蛋白 质 结构 预测 中 应 用 ,如 遗传 算法 、 模 拟 退 火 、 多 维 统 
计 、 模 糊 集合 论 方法 等 。 通 过 对 一 些 简单 蛋白 质 分 子 的 模拟 研究 ,这 些 新 方法 已 经 
显示 出 强 有 力 的 生命 力 。 随 着 这 些 新 方法 的 进一步 改进 和 完善 ,蛋白 质 折 丢 这 一 
分 子 生 物 学 中 的 难题 将 有 望 得 到 逐步 解决 。 


本 章 学 习 要 点 : 

(1). 了 解 生物 信息 学 的 基本 概念 和 主要 研究 内 容 。 
(2) 了 解 Blast 基本 方法 。 

(3) 了 解 主 要 的 生物 信息 学 网 站 数据库。 
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第 三 章 ”数值 方法 中 的 误差 


第 一 节 学习 生命 科学 中 数值 方法 的 意义 


现代 生命 科学 的 发 展 越 来 越 多 地 要 求 用 数学 的 方法 对 生命 现象 进行 定量 研 
究 。 例 如 ,现代 生命 科学 提出 了 相当 多 复杂 的 数学 模型 ,其 中 涉及 许多 非 线 性 的 代 
数 或 微分 方程 ,对 于 这 类 复杂 的 数学 模型 ,经 典 的 数学 解析 法 是 无 能 为 力 的 ,必须 
借助 数值 方法 利用 计算 机 求解 。 因 此 ,数值 法 在 生命 科学 领域 内 占有 极其 重要 的 
地 位 ,是 促进 现代 生命 科学 技术 发 展 的 重要 因素 。 

数值 方法 又 称 非 直接 解法 , 它 应 用 算术 运算 求解 实际 数学 问题 ,其 求解 结果 是 
近似 且 离 散 的 。 在 现代 科学 研究 和 工程 计算 中 ,常用 的 计算 机 数值 方法 已 成 为 现 
代 科 研 人 员 和 工程 技术 人 员 必 不 可 少 的 研究 方法 。 计 算 机 的 出 现 大 大 促进 了 数值 
方法 的 发 展 ,而 人 们 只 有 掌握 了 数值 方法 ,才能 合理 地 选择 .使 用 或 编写 计算 机 程 
序 , 从 而 达到 利用 计算 机 解决 实际 计算 问题 的 目的 。 因 为 解决 同一 个 数学 问题 ,如 
非 线性 方程 求解 就 有 和 迭代 法 .牛顿 法 等 不 同 解法 ,不 同 解法 又 各 有 优 缺 点 。 

在 计算 机 出 现 以 前 ,人 们 主要 采用 解析 法 或 精确 法 、 图 解法 和 计算 器 手工 求解 
法 等 求解 实际 数学 问题 。 尽 管 许多 实际 问题 的 求解 有 现成 的 公式 或 固定 的 直接 
法 ,如 五 次 以 下 的 多 项 式 方程 有 公式 解法 ,计算 定 积分 有 牛 - 莱 公式 等 ,但 绝 大 多 数 
实际 问题 用 求解 析 解 的 方法 并 不 适宜 ,甚至 很 难 实现 。 例 如 五 次 以 上 的 多 项 式 方 
程 就 没有 公式 解法 ,所 有 的 超越 方程 也 没有 公式 解 ; 当 被 积 函数 的 原 函 数 不 能 用 初 
等 函数 表示 时 ,无 法 使 用 牛 - 莱 公式 来 计算 定 积分 。 有 的 问题 虽 有 解析 解 , 但 由 于 
函数 关系 太 复杂 ,其 实用 价值 也 不 大 。 尽 管 图 解法 通常 用 来 解决 复杂 的 计算 问题 ， 
但 应 用 范围 很 有 限 , 且 结果 很 不 准确 ,另外 无 计算 机 帮助 的 图 解法 非常 费时 也 很 难 
实现 。 手 工 计算 慢 且 费时 ,并 且 多 次 手工 计算 产生 的 简单 误差 累积 导致 很 难得 到 
准确 结果 。 因 此 ,用 计算 机 数值 方法 求解 实际 问题 已 成 为 一 种 重要 方法 ,被 大 量 地 
用 于 解决 数值 型 的 问题 。 

自 20 世纪 40 年 代 末 以 来 ,数字 计算 机 的 广泛 应 用 使 得 数值 方法 得 到 飞速 的 
发 展 。 由 于 数值 方法 的 发 展 和 实际 问题 的 需要 ,涌现 出 大 量 的 计算 方法 子 程序 和 
数值 计算 软件 ,为 生命 科学 技术 人 员 解 决 实际 工程 问题 提供 了 相当 方便 的 条 件 。 
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但 是 对 于 缺乏 数值 计算 基础 知识 和 应 用 能 力 的 人 而 言 , 绝 不 可 能 有 效 地 应 用 这 些 
软件 解决 实际 计算 问题 。 因 为 使 用 任何 精密 而 完善 的 子 程序 去 解决 具体 问题 时 ， 
都 可 能 遇 到 种 种 困难 和 问题 。 这 些 难题 可 能 由 如 下 原因 所 引起 :数学 模型 未 能 准 
确 地 反映 实际 生命 现象 和 过 程 ,选用 的 数值 方法 不 恰当 ,方法 的 误差 超过 实际 问题 
允许 的 误差 ,选用 子 程序 的 实际 使 用 条 件 不 恰当 ,在 解决 具体 工程 问题 时 未 作 相 应 
的 修改 或 调整 等 。 这 些 问 题 不 解决 ,常常 会 导致 计算 失败 。 实 际 上 ,在 使 用 任何 子 
程序 时 ,都 需要 用 户 根据 实际 问题 编写 某 些 程序 子 以 补充 和 修改 。 至 于 在 众多 的 
子 程序 中 选择 适合 于 解决 具体 计算 问题 的 最 优 子 程序 , 则 需要 更 为 坚实 的 数值 方 
法 基础 知识 。 可 见 , 生 命 科学 技术 人 员 必 须 掌 握 数值 方法 。 

对 于 生命 科学 技术 人 员 来 说 ,学 习 数值 方法 的 目的 在 于 掌握 各 种 数值 计算 技 
巧 ,合理 利用 计算 机 解决 实际 计算 问题 。 因 此 ,学 习 的 重点 应 放 在 对 各 种 算法 的 原 
理 理 解 及 应 用 上 ,重要 的 是 合理 选择 和 应 用 这 些 算法 去 解决 实际 问题 ,而 对 某 些 数 
学 问题 及 其 证 明 , 仅 作 一 般 性 了 解 即 可 。 





第 二 节 ”近似 值 和 舍 入 误差 


数值 方法 求 得 的 是 数学 模型 的 近似 解 ,因此 必须 知道 其 准确 程度 。 在 许多 实 
际 计算 中 ,虽然 不 必 追 求 真 解 ,但 却 要 求 了 解 近似 解 的 误差 范围 。 为 此 有 必要 简要 
地 介绍 一 些 误差 基本 知识 。 

1. 有 效 数 字 

在 表示 一 个 近似 数值 时 ,常常 要 用 到 “有 效 数字 ”的 概念 。 图 3 - 1 测速 计 显示 
汽车 正 以 48 一 49 km/h 的 速度 行驶 ,由 于 指针 偏远 中 间 点 ,可 以 说 汽车 正 以 约 
49 km/h 速 度 行驶 ,但 如 要 求 将 汽车 行驶 速度 估计 至 1 位 小 数 点 时 ,可 能 有 人 认为 
是 48.8 km/h, 而 有 人 则 认为 是 48. 9 km/h, 由 于 测速 计 自 身 的 限制 ,只 有 第 2 位 
数字 是 非常 准确 的 ,而 第 3 位 估计 数字 (或 更 多 ) 则 被 看 成 近似 值 。 图 3 - 1 里 程 计 
显示 汽车 总 计 行程 少 于 87 324. 5 km, 而 第 7 位 数字 则 是 不 确定 的 。 

所 谓 有 效 数字 即 是 能 够 反映 数值 准确 程度 的 数字 ,一 般 由 几 位 准确 数字 和 另 
一 位 估计 数字 组 成 ,如 图 3 - 1 可 以 得 到 3 位 和 7 位 有 效 数字 , 即 : 测 速 计 读数 为 
48. 8, 而 里 程 计 读数 为 87 324. 45。 其 定义 是 在 一 个 近似 数 中 ,从 左边 第 一 个 不 是 
0 的 数字 起 ,到 精确 到 的 位 数 止 ,这 中 间 所 有 的 数字 都 叫 这 个 近似 数字 的 有 效 
数字 。 

尽管 有 时 可 以 直接 确定 出 某 个 数值 的 有 效 数字 ,但 有 时 却 非常 困难 。 如 零 并 
不 总 能 代表 有 效 数字 ,0. 000 001 234、0. 000 123 4 和 0. 001 234 均 有 4 位 有 效 数 
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图 3-1 桨 明 有 效 数字 概念 的 汽车 里 程 计 和 测速 计 示意 图 


字 。 同 样 大 型 数值 尾部 的 零 也 无 法 确定 其 准确 性 ,如 45 300 可 能 具有 3 位 ,4 位 或 
5 位 有 效 数 字 , 这 主要 取决 于 尾部 零 的 准确 程度 ,采用 科学 计数 法 则 可 以 解决 这 类 
数值 的 有 效 数字 问题 ,如 4. 53 X 10!，4. 530X 10!，4. 530 0X 104 分 别 代表 3 位 、 
4 位 和 5 位 有 效 数字 。 

在 数值 方法 研究 中 ,有 效 数字 概念 具有 以 下 两 方面 的 作用 : 

(1) 数值 方法 的 求解 结果 是 近似 的 ,有 效 数 字 则 有 助 于 了 解 其 近似 解 的 准确 
程度 ,如 :求解 结果 准确 至 4 位 有 效 数字 , 则 可 决定 该 近似 值 可 接受 。 

(2) 虽然 x、e 或 /7 代表 了 特定 的 值 ,但 它们 不 能 准确 地 由 有 限 位 数 表示 ,如 : 
x 一 3. 141 592 635 897 932 384 626 43…。 但 在 具体 问题 的 计算 中 ,往往 涉及 无 穷 
小 数 或 位 数 很 多 的 数 ,但 计算 机 的 位 数 则 是 有 限 的。 因此 ,在 计算 机 的 运算 过 程 中 
必然 会 发 生 用 有 限 小 数 代 替 无 穷 小 数 ,或 用 有 限 位 的 数 代替 位 数 很 多 的 数 ,如 用 
3. 141 59 代替 x。 由 于 计算 机 位 数 有 限 计算 中 使 用 * 四 舍 五 人 ?或 其 他 规则 取 近 似 
值 ,这 样 引起 的 误差 称 作 舍 入 误差 。 舍 入 误差 和 有 效 数字 的 应 用 将 能 够 了 解 近似 
解 的 准确 程度 。 

近似 值 z" 的 伟人 误差 不 超过 其 最 后 一 位 数字 的 半 个 单位 。 如 r 取 3. 141 59， 
则 |x 一 3. 141 59|1<0. 000 005 一 喜 X0. 000 01. 


2. 绝对 误差 和 相对 误差 
车 用 zxz” 表示 准确 值 x 的 某 个 近似 值 , 则 近似 值 z” 的 绝对 误差 
E(xr)=7r—7" 


通常 情况 下 ,准确 值 x 是 未 知 的 ,故常 常 不 可 能 算出 绝对 误差 E(x) 的 真实 值 ， 
而 只 能 根据 实际 情况 估计 其 绝对 值 的 范围 ,也 就 是 估计 | E(z) | 的 上 限 , 即 


iE(n|= |r—r: I<” 
7 称 作 近 似 值 z” 的 绝对 误差 限 ,通常 也 把 绝对 误差 限 简称 为 绝对 误差 ,一 般 可 写作 


Ea 


工 一 并 + y 


这 样 , 7 反映 了 近似 值 zx" 的 可 信赖 程度 。 
近似 值 的 +” 的 相对 误差 


实际 上 ,由 于 准确 值 x 并 不 知道 ,通常 又 定义 
E(x}. = 
ne 


zr 


E.(zx)= 
相对 误差 不 仅 可 以 表示 近似 值 +” 的 误差 大 小 ,而 且 可 以 表示 其 准确 程度 ,要 
比 绝对 误差 的 概念 更 为 完善 ,例如 有 xz 二 10 土 1 与 y= 1000 土 5 两 个 数 ,试问 10 和 
1 000 哪个 数 近似 值 更 能 准确 地 反映 其 对 应 的 真实 值 ? 若 用 绝对 误差 表示 ,那么 近 
似 数 y”== 1 000 的 误差 | E(y) | == 5, 而 近似 数 z”= 10 的 误差 仅 为 | E(x)| = 1， 
似乎 z" 更 准确 些 。 其实 不 然 , 若 考 虚 到 近似 数 本 身 的 大 小 ,E,(y) 仅 为 y” 的 
0.5%, 而 E(x) 则 为 x* 的 10%。. 显 然 y” 比 x" 更 准确 些 , 故 相对 误差 比 绝对 误差 
更 能 准确 地 表示 一 个 近似 值 的 准确 程度 。 
与 绝对 误差 一 样 ,由 于 不 知道 ,常常 不 能 确定 相对 误差 E.(x) 的 准确 值 ,而 
只 能 估计 其 绝对 值 的 上 限 , 即 上 限 


IECol= | 三 |<e 


6 称 作 z” 的 相对 误差 限 ,通常 也 把 它 简称 为 相对 误差 ,显然 ,相对 误差 限 与 绝对 误 
差 限 有 如 下 关系 : 


第 三 节 截断 误差 和 泰勒 级 数 


在 实际 问题 计算 中 ,常常 会 遇 到 超越 运算 ,这 就 要 求 用 极限 和 无 穷 过 程 来 表 
示 。 但 在 实际 计算 时 ,只 能 进行 有 限 次 运算 ,因而 只 能 求 得 其 近似 值 。 例 如 ,在 数 
值 方法 中 常 采用 收敛 无 穷 级 数 如 泰勒 级 数 的 前 ”项 代替 无 穷 级 数 ,也 就 是 抛弃 了 
无 穷 级 数 的 后 几 项 ,由 此 引起 的 误差 称 作 截 断 误差 。 


一 和 二 


一 、 泰勒 级 数 


在 微 积 分 中 知道 ,如 果 函 数 f(z) 在 zo 的 某 个 邻 域内 有 直到 ”十 1 阶 导数 , 则 在 
这 个 邻 域内 








Jr = za) 十 PCza)(z 一 各 ) 十 下 PCGzo)(z 一 ao 十 …1 
直 Am (za)(Cz 一 aa) 十 ReCz) 


式 中 : 


ntl1) 
R,(z) = 办 (zm (3.1) 


式 中 ; 8 是 zo 与 x 之 间 的 某 个 值 。 上 式 称 为 函数 f(x) 在 zo 处 的 泰勒 公式 ,Ru(z) 是 
余 项 。 当 


lim R(Cz) 一 0 


时 ,函数 /(z) 可 表示 成 知 级 数 的 形式 : 





f(D = fx) + 了) rz) + 让 fz) (rx)? 十 …+1 





下 (xzo)(z 一 zo)" 


上 式 称 为 函数 f(z) 在 zo 处 的 泰勒 级 数 。 
以 后 经 常 要 用 到 泰勒 公式 和 泰勒 级 数 中 的 前 几 项 逼近 函数 。 如 只 取 第 一 
项 ,有 


fz) ~ f(x0) 
即 用 常数 f(zxo) 通 近 函 数 f(z) ; 取 前 两 项 , 则 有 
f(z) fz0) tf xo) zr— ro) 
即 用 直线 (线性 函数 ) 副 近 函 数 f(x) ; 取 前 三 项 , 即 有 





f(D) ~ (ma) 十 PCzo)(z 一 aa) 十 于 /za)(z 一 za 


即 用 抛物 线 ( 二 次 函数 逼近 函数 f(z)。 
通常 n 次 多 项 式 可 以 准确 地 由 n 次 泰勒 级 数 表示 ,而 微分 和 连续 函数 如 指数 和 


和 2 


正弦 曲线 函数 等 无 法 由 有 限 次 的 泰勒 级 数 表示 ,次数 越 多 越 逼 近 真实 值 , 但 只 有 无 
穷 次 泰勒 级 数 才 与 真实 值 一 致 .实际 计算 过 程 中 ,常常 采用 收敛 无 穷 级 数 的 前 项 
代替 无 穷 级 数 ,其 计算 结果 足以 接近 真实 值 ,而 由 此 带 来 的 误差 即 截断 误差 可 由 余 
项 公式 计算 。 但 求解 余 项 并 非 易 事 ,因为 5 为 ze 与 工 之 间 的 某 个 值 ,很 难 确 定 ; 另 
外 ,只 有 已 知 f(x) 才能 求 取 f(z) 的 (2 十 1) 阶 导数 .事实 上 ,如 果 已 知 f(x) ,根本 
无 需 采 用 泰勒 级 数 求解 函数 值 .尽管 如 此 , 式 (3. 1) 仍然 有 助 于 判断 截断 误差 值 。 由 
式 (3. 1) 知 , 余 项 除 与 /“"(&) 有 关外 ,还 与 (x 一 zxo) 二 hh 和 nn 有关, 因此 在 数值 计 
算 过 程 中 ,为 减少 截断 误差 , 需 合 理 选 树 步 长 h 入 次 泰勒 级 数 。 
如 果 在 给 定 的 区 间 内 , f™" (zx) 有 界 , 即 


[If ?DIEM 
则 


RD < sil |= Oh™) 


式 中 :hh = x 一 ,可 见 截断 误差 R,(z) 与 im; 有关 ,这 对 截断 误差 的 判断 非常 有 
用 ,车 误差 为 0(h) , 则 步 长 减 半 , 误 差 就 碱 半 ; 而 误差 为 Qiz) 时 , 步 长 碱 半 ,误差 
则 碱 至 四 分 之 一 ,可见 h 越 小 ,有 限 次 的 泰勒 级 数 就 能 得 到 合理 的 函数 计算 值 , 泰 
勒 级 数 次 数 越 大 , 鹤 断 误差 越 低 。 

[ 例 3-1] 求 积分 edz 的 近似 值 。 
将 积分 泰勒 展开 后 ,可 得 


6 8 


j++ 有 














若 只 取 前 四 项 , 则 有 


EO PE Wy MEO OR Rh 
fe dr 心 1 一 训 十 剖 X 守 一 剖 X 了 一 0.743 
截断 误差 为 
= Ll Ll 
R= Xo Wi 
1RI 王 十 x 寺 一 0.005 


a 


二 、 误 差 的 传递 
在 计算 过 程 中 ,误差 的 量 会 传递 给 计算 结果 ,因此 在 数值 计算 中 必须 考虑 运算 
误差 对 结果 的 影响 。 
1. 一 元 函数 
函数 f(z) 为 的 一 元 函数 ,r+ 有 误差 ,其 近似 值 为 xz" ,由 此 可 计算 当 用 x" 近 
似 代替 工时 f(z) 的 绝对 误差 : 
Aflr*) = |f(7)— fr")| 


设 z' 为 x 的 邻近 值 , 且 f(x* ) 为 连续 可 微 函 数 , 则 /(x" ) 值 可 应 用 泰勒 级 数 计算 





flr) = fr )+f rr rr )+ Lr xz) 二 


如 取 前 两 项 , 则 有 
oz) 一 /xz ) 一 Pr (rr) 
或 
AF(z') 一 |Fzr')|(z 一 z) (3.2) 
由 式 (3. 2) 可 计算 函数 F(z) 的 绝对 误差 。 
2. 多 元 函数 


如 一 元 函数 一 样 , 多 元 函数 同样 可 用 泰勒 公式 进行 展开 ,如 二 元 函数 f(x， 
>) ,由 (z，y) 点 可 得 : 
flrin, y+1) 
= fis y) +r -z+ 一 y%) 十 





2 2 2 
ES .+2 站 X(N w+ om 2 … 


如 果 忽 略 二 阶 和 更 多 阶 偏 导数 , 则 由 上 式 可 计算 近似 值 (x"，y* ) 所 引起 的 函数 
f(x，y) 的 绝对 误差 为 


we MM 


同样 可 估算 由 近似 值 x? ,zx; ,，…， zx; 的 误差 Ax? ,Ar; ,…, Ax; 引起 的 n 元 函 
数 f(x，x，…， XX,) 的 绝对 误差 : 
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a ~ | 总 | sO A ee | 吝 | : 
Af(x? ,zx?， x | ari + | Ian + 十 | 元。 Arzr 


以 上 方程 可 用 来 估计 由 近似 值 代替 真实 值 引起 的 误差 传递 。 

一 般 来 说 ,在 分 析 运 算 误差 时 ,要 考虑 以 下 一 些 原则 : 

(1) 两 个 相近 的 数 相 减 ,会 严重 丢失 有 效 数字 ; 

例如 al = 0. 123 45， as 一 0. 123 46, 各 有 5 位 有 效 数字 .而 az 一 cl 一 0.00001， 
只 剩 下 1 位 有 效 数字 。 

(2) 避免 绝对 值 太 小 的 数 作 除 数 。 

除数 绝对 值 较 小 时 , 商 的 绝对 值 会 很 大 ,有 可 能 出 现 浮 点 溢出 。 

(3) 防止 大 数 “ 吃 掉 ” 小 数 。 

因为 计算 机 只 能 采用 有 限 位 数 计算 , 若 参 加 运算 的 数量 级 差别 很 大 的 话 , 在 加 
减 运算 中 ,绝对 值 很 小 的 数 往 往 被 绝对 值 较 大 的 数 “ 吃 掉 ”, 造 成 计算 结果 失真 。 

[ 例 3-2] 求 方程 

妇 2 一 (10" 十 1D)z 十 10" 一 0 


的 根 。 
方程 的 两 个 根 分 别 为 10” 和 1, 如 果 用 计算 机 采用 两 次 方程 的 求 根 公式 计算 ， 


一 二 0 士 V 克 一 4 
2a 
在 计算 机 内 , 10? 存 为 0. 1X108 ,1 存 为 0. 1 X 10!。 做 加 法 时 ,两 加 数 的 指数 先 向 
大 指数 对 齐 , 再 将 浮 点 部 分 相 加 , 即 1 的 指数 部 分 须 变 为 10" , 则 :1 一 0. 000 000 000 1 x 
10%, 取 单 精度 时 就 成 为 : 


10 +1= 0.10000000x10"+0.00000000xX10" = 0.10000000xX10" 

















a —b+ Vb — 4ac 3 10, z= 1 0 
实际 上 zz 应 等 于 1。 


在 运算 过 程 中 必须 注意 合理 安排 运算 顺序 ,以 便 提 高 运算 的 精度 或 保护 重要 
的 参数 ; 

(4) 简化 计算 步骤 以 减少 运算 的 次 数 。 

同样 一 个 问题 ,如 果 能 减少 运算 次 数 ,不 但 可 以 减少 计算 时 间 , 还 能 减少 舍 人 误 
差 的 传播 。 如 计算 x* 的 值 ,车 将 z 的 值 逐 个 相 乘 , 则 需 做 62 次 乘法 ,但 如 果 写 成 


i 


.Ee 


只 要 做 10 次 乘法 就 可 以 了 。 

三 、 非 计算 误差 来 源 

为 了 分 析 误差 来 源 , 先 初步 了 解 一 个 实际 问题 的 解决 需要 经 过 哪些 步骤 。 首 
先 根据 生命 科学 问题 中 生物 、 化 学 或 物理 实际 现象 及 真实 过 程 的 物理 概念 ,经 过 适 
宜 的 假设 和 简化 建立 过 程 的 物理 模型 ;然后 再 经 过 必要 的 归纳 和 数学 推导 建立 数 
学 模型 ;最 后 应 用 数学 方法 求解 这 些 数 学 模型 ,将 计算 结果 与 实验 结果 比较 ,如 有 
需要 , 则 对 模型 进行 修正 并 重复 上 述 步骤 ;再 应 用 这 些 数学 解 来 定量 地 说 明 实 际 过 
程 ,从 而 达到 定量 分 析 和 预测 实际 过 程 的 目的 。 其 中 的 非 计 算 误差 可 分 为 模型 误 
差 和 观测 误差 。 

1. 模型 误差 

根据 实际 问题 建立 数学 模型 时 ,必须 经 过 某 种 程度 的 简化 和 归纳 , 即 所 谓 “ 理 
想 化 ”处理 。 这 种 处 理 一 方面 为 了 使 具体 问题 抽象 化 ,使 模型 具有 普 适 性 ; 另 一 方 
面 为 了 使 模型 简化 ,便于 进行 数学 处 理 。 这 就 造成 了 模型 与 实际 问题 间 的 误差 ,这 
种 误差 称 作 模型 误差 。 但 应 明确 ,这 类 误差 不 是 数值 方法 的 某 种 算法 所 造成 的 ,而 
是 模型 本 身 带 来 的 。 

2. 观测 误差 

任何 数学 模型 中 都 包含 一 些 实验 测定 的 参数 ,而 任何 精密 仪器 都 只 能 测 得 这 
些 参数 的 近似 值 ,所 以 在 模型 参数 中 存在 实际 测定 值 与 真实 值 之 间 的 误差 ,这 类 误 
差 称 为 观测 误差 。 观 测 误差 也 不 是 某 种 算法 造成 的 ,其 大 小 与 实验 仪器 的 精密 程 
度 .实验 测定 次 数 及 参数 测定 或 估计 方法 有 关 。 

模型 误差 和 观测 误差 虽然 与 算法 无 关 , 不 可 能 用 改善 算法 的 办 法 来 降低 这 些 
误差 ,但 实际 问题 的 计算 者 必须 了 解 这 些 误 差 的 大 小 以 及 它们 在 计算 过 程 中 的 传 
递 ,以 便 对 最 终 计算 结果 进行 合理 分 析 。 

在 任何 实际 问题 的 计算 中 ,从 模型 建立 到 应 用 计算 机 获得 最 终结 果 的 整个 过 
程 中 ,可 能 会 引入 种 种 误差 :如 与 数值 方法 无 关 的 模型 误差 和 观测 误差 ,与 数值 方 
法 密 不 可 分 的 舍 信 误差 和 截断 误差 等 ,计算 者 必须 对 这 些 误 差 做 出 判断 和 估计 , 否 
则 所 得 结果 将 是 毫 无 意义 的 。 


本 章 学 习 要 点 : 

(1) 了 解数 值 方法 的 概念 。 

(2) 了 解 有 效 数字 、 舍 人 误差 .截断 误差 。 
(3) 理解 算法 的 稳定 性 。 
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第 四 章 “MATLAB 软件 与 数值 计算 功能 


第 一 节 引 言 


MATLAB 是 由 美国 的 Mathworks 公司 于 1984 年 推出 的 一 套数 值 计算 软件 。 
MATLAB 的 名 称 出 自 MATrix LABoratory, 原 意 为 矩阵 实验 室 , 最 开始 是 专门 用 
于 矩阵 计算 的 软件 。 自 MATLAB 4. 0 问世 以 来 ,MATLAB 语言 就 逐渐 成 为 最 具 
吸引 力 .应 用 最 为 广泛 的 数值 科学 计算 语言 之 一 。 如 今 ,MATLAB 已 成 为 集 数值 
计算 功能 ,符号 计算 功能 和 计算 可 视 化 为 一 身 的 科学 计算 语言 。 

MATLAB 软件 的 计算 功能 非常 强大 ,用 户 只 要 拥有 了 MATLAB 软件 ,就 可 
以 方便 地 处 理 诸如 矩阵 变换 及 运算 、 多 项 式 运算 、 微 积分 运算 、 线 性 与 非 线 性 方程 
求解 . 常 微分 方程 求解 、 偏 微分 方程 求解 、 插 值 与 拟 合 ,特征 值 问题 .统计 及 优化 的 
问题 了 。 

MATLAB 语言 简单 , 它 允 许 用 户 以 数学 形式 的 语言 编写 程序 , 比 BASIC、 
FORTRAN 和 C 语言 等 更 接近 书写 计算 公式 的 思维 方式 。 它 的 操作 和 功能 函数 
指令 就 是 平时 计算 机 和 数学 书 上 的 一 些 简单 的 英文 单词 。 由 于 它 是 用 C 语言 开发 
的 , 它 的 不 多 的 几 个 程序 流 控制 语句 同 C 语言 差别 很 小 , 易 为 初学 者 掌握 。 

MATLAB 的 扩充 能 力 和 可 开发 性 强 。MATLAB 本 身 就 像 一 个 解释 系统 ,对 
其 中 的 函数 程序 的 执行 是 一 种 解释 执行 的 方式 ,最 大 的 好 处 是 使 MATLAB 完全 
成 了 一 个 开放 的 系统 ,用 户 可 以 方便 地 看 到 其 函数 的 源 程序 ,也 可 以 方便 地 开发 自 
己 的 程序 ,其 至 创建 自己 的 “ 库 ”。 另外, MATLAB 可 以 和 FORTRAN.C 等 语言 
接口 ,充分 利用 各 种 资源 ,用 户 只 需 将 已 有 的 EXE 文件 改 成 MEX 文件 ,就 可 以 方 
便 地 调用 有 关 程 序 和 子 程序 。 

MATLAB 软件 开发 的 初衷 是 方便 地 进行 矩阵 运算 或 数值 运算 ,但 随 着 商业 
软件 的 推广 ,MATLAB 不 断 升 级 ,一 般 每 年 推出 两 个 升级 版 本 , 目前 最 新 的 版 本 
是 MATLAB R2012b。MATLAB 包含 有 60 多 个 工具 箱 , 可 以 解决 数学 和 其 他 工 
程 领域 的 绝 大 多 数 问题 ,如 信号 处 理 、 神 经 网 络 .和 鲁 棒 控 制 、 系 统 识 别 、 控 制 系统 、 实 
时 工作 、 图 形 处 理 、 光 谱 分 析 、 频 率 识别 .模型 预测 ,模糊 逻辑 .数字 信 号 处 理 、 定 点 
设置 .金融 管理 .小 波 分 析 、 地 图 工具 、 交 流通 信 、 模 型 处 理 .LMI 控制 .概率 统计 、 样 








ey 


条 处 理 、 工 程 规 划 、 非 线性 控制 设计 .QFT 控制 设计 .NAG 和 偏 微分 方程 求解 等 。 

MATLAB 有 两 个 工具 箱 和 生物 学 密切 相关 , 其 中 生物 信息 学 工具 箱 
(Bioinformatics Toolbox) 为 MATLAB 提供 了 一 个 分 析 基 因 组 和 蛋白 质 组 的 完整 
的 软件 环境 。 用 户 可 从 MATLAB 界面 进入 NCBI 等 数据 库 , 可 方便 地 进行 序列 
分 析 , 构 建 分 子 系统 发 生 树 等 ;还 可 用 于 计算 生物 学 和 设计 新 算法 ,创建 可 独立 于 
运行 的 应 用 程序 并 得 到 可 视 化 结果 ;该 工具 箱 还 可 用 于 质谱 分 析 、 统 计 推论 与 预测 
功能 。 

生物 系统 模拟 工具 箱 (SimBiology) 是 一 种 可 用 于 在 集成 的 图 形 环境 中 建 模 、 
仿真 和 分 析 生 物 系统 和 生化 路 径 的 工具 。SimBiology 为 群体 药 代 动力 学 PK) 和 
药物 动力 学 (PD) 的 建 模 和 分 析 提 供 更 直观 和 灵活 的 环境 ,可 提供 个 体 与 群体 拟 合 
结果 的 诊断 图 。 

可 见 ,MATLAB 是 一 个 高 度 集成 的 软件 系统 ,有 友好 的 界面 ,通过 交互 式 的 
命令 可 以 十 分 简易 地 实现 许多 复杂 的 算术 运算 。 本 章 简略 介绍 MATLAB 软件 的 
数值 计算 功能 ,需要 详细 了 解 请 参阅 相关 的 软件 使 用 指南 。 





第 二 节 ”MATLAB 的 语言 结构 


MATLAB 有 两 种 工作 方式 ,一 种 是 键盘 逐 行 输入 命令 ,MATLAB 立即 执行 
并 显示 结果 ; 另 一 种 是 执行 一 个 命令 语句 集 文件 , 它 自动 地 按照 文件 中 排 好 的 命令 
和 语句 ,顺序 执行 并 显示 结果 。 这 种 命令 语句 集 文件 必须 使 用 扩展 名 “. m”, 因此 
称 为 M 文件 。 我 们 来 看 一 个 例子 :用 MATLAB 计算 3 十 5X3 十 6 的 算术 运算 结 
果 。 一 种 方法 是 直接 在 MATLAB 指令 窗 里 输入 以 下 内 容 : 


3°2 二 5#*3 十 6 
在 上 述 表达 式 输入 完成 后 , 按 回 车 键 ,该 指令 被 执行 ,并 显示 如 下 结果 : 


ans 一 


30 
另外 一 种 方法 是 首先 编写 个 funl. M 文件 来 定义 函数 y, 其 格式 为 


function y 一 funl(x) 
y 一 x 2 十 5x 十 6 


然后 在 MATLAB 的 命令 窗口 里 输入 


二 42 二 


x 一 3; 
y=funl(x); 
即 可 得 到 如 下 结果 : 
y=30 
M 文件 在 功能 上 可 分 为 两 种 类 型 :文本 文件 和 函数 文件 。 文 本 文件 包含 一 系 
列 专门 的 MATLAB 语句 , 当 运 行 一 个 文本 文件 时 ,将 自动 运行 一 系列 命令 并 产生 
最 后 的 结果 ,文本 文件 的 语句 在 工作 空间 中 运算 全 局 变量 。 它 对 程序 设计 中 所 需 
重复 实现 的 执行 过 程 ,对 复杂 命令 的 解释 十 分 有 用 。 
如 果 M 文件 的 第 一 行 包含 "function”, 则 这 个 文件 为 函数 文件 。 函 数 文件 中 
定义 的 变量 均 为 局 部 变量 。 其 基本 格式 为 : 
function[f ,fz,... J]=fun(xyy,2z,...) 
式 中 ;x,y, z，,.…. 是 形式 输入 参数 ,而 fi ,f，... 是 返回 形式 的 函数 输出 值 。 调 用 
一 个 函数 只 需 直 接 使 用 与 这 函数 一 致 的 格式 : 
fun [yi vy2)... J=fun(Ci,j,k,...) 
式 中 :ij,k 是 相应 的 输入 参数 ,而 wm ,y 是 相应 的 输出 函数 值 。 
函数 文件 的 功能 是 建立 一 个 函数 , 且 这 个 函数 可 以 同 MATLAB 的 库 函 数 一 
样 地 使 用 。 


第 三 节 ”和 矩阵、 变量 .运算 和 表达 式 


MATLAB 的 基本 运算 对 象 是 矩阵 ,向 量 可 作为 矩阵 的 一 列 或 一 行 , 数 可 以 视 
作 1 行 1 列 的 矩阵 ,MATLAB 是 通过 键入 命令 或 命令 语句 的 方式 实现 功能 的 。 除 
了 MATLAB 特定 的 命令 外 ,可 用 由 矩阵 (和 矩阵) 变量 和 运算 符 构成 的 表达 式 命令 
实现 各 种 运算 。 


一 、 撼 阵 的 输入 


矩阵 有 多 种 输入 方式 ,如 通过 语句 或 函数 产生 或 用 M 文件 或 外 部 数据 文件 产 
生 。 最 简单 的 方式 为 直接 输入 。 输 入 时 ,矩阵 元 素 置 于 一 对 方 括号 内 ,元 素 之 间 用 
空格 或 逗号 分 开 , 和 矩阵 的 不 同行 用 分 号 隔 开 。MATLAB 没有 描述 矩阵 维 数 和 类 
型 的 语句 ,它们 是 由 输入 的 格式 和 内 容 来 确定 的 。 

例如 创建 一 简单 数值 矩阵 。 


二 和 


A=[1,2,3;1,1,1;4,5,6] 


在 MATLAB 中 ,大 的 矩阵 可 以 分 行 输入 , 行 的 分 隔 可 用 回 车 代替 分 号 实现 。 
这 样 的 输入 形式 更 接近 于 我 们 平时 使 用 矩阵 的 数学 形式 。 如 
A=[1 2 3 
iT 
4 5 6] 


矩阵 的 输入 也 可 以 通过 建立 M 文件 来 完成 。 例 如 建立 一 个 A. M 的 文件 ,其 内 
容 为 
A=[1 2 3 
让 
4 5 6] 


则 在 工作 环境 中 使 用 A 命令 就 可 调 出 A 和 矩阵。 
二 、 和 矩阵 的 运算 


和 矩阵 的 基本 数学 运算 包括 矩阵 的 四 则 运算 ,与 常数 的 运算 、 逆 运算 ,行列 式 运 
算 、 寡 运算 、 指 数 运算 对 数 运 算 、 开 方 运算 等 。 

1. 变量 与 表达 式 

MATLAB 的 赋值 语句 有 两 种 形式 ,一 种 形式 为 < 变量 之 一 表达 式 , 另 一 种 简 
单 的 形式 < 表达 式 之 ,后 者 将 表达 式 的 值 赋予 一 个 自动 定义 的 变量 ans。 

若 要 了 解 已 经 定义 的 变量 ,可 用 who 命令 ,用 whos 命令 可 显示 已 定义 的 变量 
及 有 关 此 变量 的 维 数 等 信息 。 

2 矩阵 的 运算 符 

和 矩阵 的 初等 运算 符 为 “十 ” “一 ” “x”,“/( 右 除 )”“\( 左 除 )” 和 ““( 短 )”。 
“十 ”一 ”“ x ”实现 两 矩阵 的 加 、 减 和 乘法 运算 。““( 咕 )” 是 矩阵 的 短 运 算 , 参 加 
运算 的 矩阵 必须 为 方 阵 。 右 除 和 左 除 的 意义 规定 如 下 :C 一 A/B 即 C 满足 CB 一 A， 
而 C=A\B 即 C 满足 AC=B。 当 也 为 可 北方 阵 时 A/B 一 AB ', 当 A 为 可 北方 阵 
时 ,A\B 二 A !'B。 和 矩阵 的 右 除 要 先 计算 矩阵 的 逆 再 做 矩阵 的 乘法 ,而 左 除 则 不 需 


六 二 二 


要 计算 矩阵 的 逆 而 直接 进行 除 运算 。 通 常 右 除 要 慢 一 点 ,但 对 于 一 般 矩 阵 , 两 者 几 
平 没有 差别 。 

和 矩阵 变量 或 常量 矩阵 用 运算 符 连 接 得 到 表达 式 , 运 算 的 优先 次 序 和 常规 相同 ， 
可 用 括号 改变 运算 的 优先 次 序 。 


三 、 向 量 及 下 标 


1. 向 量 的 构造 

在 MATLAB 中 ,“: ”是 一 个 重要 的 字符 ,可 以 用 来 产生 一 个 行 向 量 ; 其 基本 
格式 为 x 一 no : ni : nz ,表示 从 no 开始 ,到 ns 结束 ,数据 元 素 的 增 量 为 nm 的 一 个 行 
向 量 。 当 mi 一 1 时 可 以 简化 为 x 二 mo : m。 如 :x=1: 5 即 生成 一 个 1 一 5 单位 增 量 的 
行 向 量 ,x=[12345]; 若 x=1:0.5:4, 则 x=[1 1.5 2 2.5 3 3.5 4]。 
除 此 之 外 ,也 可 以 利用 MATLAB 函数 linspace 来 创建 向 量 。 此 函数 的 调用 格 
式 为 

linspace(first_value，last_value,number) 


该 函数 将 创建 一 个 从 first_value 开始 ,到 last_value 结束 ,包含 有 number 个 


数据 元 素 的 行 向 量 。 
2. 下 标 
单个 的 矩阵 元 素 可 以 在 括号 中 以 下 标 来 表示 。 如 
1.2 3 
并 二 和 
4 5 6 


式 中 :元 素 A(1, 2) 一 2，A(1, 3)=3, 等 等 。 下 标 也 可 以 是 一 个 向 量 ,对 于 矩阵 来 说 ， 
向 量 下 标 可 以 将 矩阵 中 相 邻 或 不 相 邻 的 元 素 构成 一 新 的 矩阵 。 如 A(1 : 3, 2) 指 A 
中 由 前 三 行 对 应 的 第 二 列 元 素 组 成 的 3X1 矩阵。 使 用 : "代替 下 标 ,可 以 表示 所 有 
的 行 或 列 。 如 A( : ,3) 代 表 第 三 列 元 素 组 成 的 矩阵 ,A(1 : 2，: ) 指 A 中 由 前 两 行 所 
有 元 素 组 成 的 矩阵 。 对 于 和 矩阵 的 赋值 语句 ,” : ”有 明显 的 优越 性 。 如 A([3 5 7], : ) 一 
B(1 : 3,: ) 表 示 将 B 和 矩阵 的 前 三 行 ,赋值 给 A 矩阵 的 第 三 ,第 五 和 第 七 行 。 

若 A(: ) 在 赋值 语句 右 侧 ,A( : ) 是 将 矩阵 A 的 所 有 元 素 排 成 一 个 单列 ,如 
A=[121135],B=A(:), 则 B=[121135]'; 若 A(:) 在 赋值 语句 左 侧 ， 
A(: ) 保 持 它 原来 的 格式 ,如 C=[111111],A(C:)=C, 则 A=Ll111111。 


四 、 数 组 及 其 运算 
MATLAB 中 ,除了 和 矩阵 以 外 ,还 有 数组 的 概念 ,它们 的 差别 主要 在 于 运算 规 
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则 的 不 同 ,数组 的 输入 与 矩阵 是 相同 的 。 

(1) 数组 的 运算 符 为 "十 "“ 一 ”“. x ”、“./”“.\”、“. ”。 可 见 , 加 减 运算 符 
与 矩阵 运算 符 相同 ,而 其 他 运算 符 则 在 相应 的 矩阵 运算 符 之 前 增加 一 点 ,有 时 为 了 
避免 两 义 性 ,可 在 运算 符 的 “. ”前 留 一 空格 。 

(2) 乘除 和 乘 寡 运算 。 数 组 的 加 减法 与 矩阵 运算 规则 相同 ,但 其 余 运算 规则 
不 同 ,数组 运算 主要 是 对 应 元 素 之 间 进 行 计算 ,A. x B 的 结果 为 A 和 B 对 应 元 素 
相 乘 得 到 的 一 个 数组 ,A. \B 的 结果 为 B 的 元 素 除 以 A 的 相应 元 素 ,A. /B 为 A 的 
元 素 除 以 B 的 相应 元 素 得 到 的 新 数组 。 

例如 A=[1 2 3], B=[4 5 6], C=A. * B, 得 

C=4 10 18 
C=A.\B, 得 
C=4.0000 2.5000 2.0000 
A.“B 得 A 的 元 素 为 底 ,以 相应 的 B 中 的 元 素 为 寡 的 数组 ,对 上 述 A.B, 如 C=A “了 B， 
则 得 
C=1 32 729 


MATLAB 的 运算 是 十 分 灵活 的 ,如 运算 对 象 不 一 定 是 体积 相同 的 数组 ,其 中 
某 一 个 可 以 是 标量 ,如 ,C 二 2."A, 得 
C=2 4 8 
如 C=A, 2, 得 


五 、 关 系 和 逻辑 运算 符 


关系 运算 符 主要 用 来 比较 数字 符 串 ,矩阵 之 间 的 大 小 和 不 等 关系 ,其 返回 值 
是 0 或 是 1。 关 系 运算 符 主要 有 ( 见 表 4- 1)。 


表 4-1 MATLAB 常用 的 关系 预算 符 











指令 | 含义 指令 含义 
ee 
<= 小 于 等 于 -一 等 于 


小 于 | >= 大 于 等 于 


~- 不 等 于 





A6= 


MATLAB 有 四 种 基本 的 逻辑 运算 符 :& (与 ),| (或 ) ,一 ( 非 ) 和 xor( 与 非 )。 
逻辑 表达 式 和 逻辑 函数 的 值 应 该 是 一 个 逻辑 量 * 真 "或 “ 假 ", 其 中 以 0 表示 “ 假 ”, 以 
1 表示 “ 真 ”。 


第 四 节 ”绘图 和 控制 语句 


MATLAB 除了 具有 强大 的 数值 分 析 工 具 外 ,还 提供 了 非常 丰富 的 图 形 绘制 
功能 。 本 节 简 单 介绍 MATLAB 的 绘图 功能 。 


一 、 二 维 图 形 函 数 


MATLAB 中 提供 了 多 种 二 维 图 形 的 绘制 命令 ( 见 表 4 - 2)。 但 其 中 最 重要 ， 
最 基本 的 是 指令 是 plot。 其 基本 调用 格式 是 : 

plot(x,y,'s') 

x,y 是 长 度 相同 的 一 维 数组 。x,y 分 别 指定 采样 点 的 横 坐 标 和 纵 坐 标 。 第 三 
个 输入 量 s' 是 字符 串 , 它 用 来 指定 绘图 的 线 型 以 及 颜色 。 如 果 没 有 指定 ,plot 将 使 
用 默认 设置 一 * 蓝 色 细 实 线 ”绘制 曲线 。 

例如 plot(xl,yl,r 十 ,x2，y2,' g *') 表 示 用 “十 ”点 方式 画 第 一 条 曲线 y ~ 
x1, 图 形 的 颜色 为 红色 ;用 “x* ”点 方式 画 第 二 条 曲线 y, 一 x ,图 形 的 颜色 为 绿色 。 

表 4-2 MATLAB 提供 的 常用 绘图 西数 





函数 功 能 函数 功 能 
area 面 域 图 plot 基本 二 维 图 形 函数 
bar 直方 图 polar 极 坐标 图 
compass 射线 图 semilogx 半 对 数 ,x 为 对 数 坐 标 
feather 羽毛 图 semilogy 半 对 数 ,y 为 对 数 坐 标 
loglog 双 对 数 坐标 图 stairs 阶梯 图 


pie 二 维 饼 图 stem 二 维 杆 图 





例如 在 MATLAB 命令 窗口 里 依次 执行 下 列 语句 : 
x=1:0.1x*pi:2*pi; 

y=sin(x); 

z=cos(x); 

plot (x,y,' kd',x,z,' k——')) 

可 以 得 到 如 图 4- 1 的 图 形 。 


-47= 











在 绘制 图 形 的 同时 ,可 以 对 图 形 加 上 一 些 说 明 ,如 图 形 名 称 ,坐标 轴 说 明 以 及 
某 一 部 分 的 含义 等 。 在 MATLAB 中 常用 的 绘图 辅助 函数 如 表 4 - 3 所 示 。 


表 4-3 常用 绘图 辅助 函数 
功 能 





titleC, ..") 
xlabel(...') 
ylabel(. .，) 
text(xry,...') 


legend( 图 例 1', ' 图 例 2'...) 


axis( Xnin Xoax » Ynins Ymex) 
grid 

hold on 

hold off 


在 图 形 上 方 将 ' 中 所 指定 的 内 容 

将 ' 中 所 指定 的 内 容 添加 在 x 轴 上 

将 ' 中 所 指定 的 内 容 添加 在 y 轴 上 

将 ' 中 所 指定 的 内 容 显 示 在 (x,y) 处 

曲线 所 用 线 型 ,颜色 以 及 数据 点 标记 图 例 。 
xy 轴 的 显示 范围 

在 图 中 显示 虚线 网 格 

后 面 plot 的 图 形 和 先前 的 亚 加 在 一 起 
解除 hold on 命令 





上 述 辅 助 绘图 命令 必须 放 在 相应 的 ' plot ' 命 令 之 后 ,此 外 ,还 有 一 个 辅助 的 命 
令 gtext(. .…) 调 用 该 函数 时 ,十 字 光标 自动 随 鼠 标 移动 , 单 击 鼠 标 即 可 将 文本 放置 


在 十 字 光 标 处 。 


绘制 图 形 时 ,MATLAB 会 自动 根据 数据 的 范围 来 选择 合适 的 坐标 刻度 ,使 得 


曲线 能 尽 可 能 清晰 地 显示 出 来 。 但 是 如 果 用 户 对 坐标 选取 范围 不 满意 ,可 以 利用 
axis 函数 对 其 进行 重新 设 定 。 在 曲线 模拟 和 数据 回归 中 ,通常 需要 观察 模拟 的 曲 
线 和 实际 数据 的 吻合 情况 。 这 常常 用 到 hold on 命令 ,hold on 命令 用 来 保持 屏幕 
上 的 当前 图 形 ,对 于 接 下 去 的 plot 命令 ,使 用 原 已 建立 的 坐标 尺寸 , 且 保 持原 有 图 














形 不 变 的 基础 上 , 稚 加 上 一 个 新 形成 的 图 形 。 
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二 、 控 制 流 
作为 一 种 计算 机 编程 语言 ,MATLAB 提供 了 多 种 用 于 程序 流 控制 的 描述 关 
键 词 。 这 里 主要 介绍 最 常用 的 循环 控制 (for，while) 和 条 件 控制 (if，switch) 。 
1. FOR 循环 结构 
这 个 结构 每 执行 一 次 就 要 判断 是 否 继续 进行 ,这 个 判断 的 依据 的 条 件 就 是 循 
环 终止 条 件 。for 循环 的 基本 格式 为 
for i 二 初 值 : 增 量 : 终 值 
语句 1 
语句 2 


语句 n 

end 

for 和 end 之 间 的 语句 行程 循环 体 。 增 量 可 以 自己 设 定 ,也 可 以 缺 省 , 缺 省 值 
为 1 执行 时 变量 i 从 初 值 开始 ,循环 体 中 的 语句 每 被 执行 一 遍 i 就 增加 一 个 增 量 ， 
直到 终 值 为 止 。 

例如 :设计 一 个 循环 ,计算 阶乘 20! 

for i=1: 20 

k=kxi 

end 

k 

2. WHILE 循环 结构 

与 for 循环 中 重复 的 次 数 是 预先 设 定 的 不 同 ,MATLAB 中 的 while 结构 在 执 
行 循环 体 之 前 首先 判断 循环 执行 的 条 件 是 否 成 立 。 若 逻辑 表达 是 为 真 , 则 执行 循 
环 体 语句 一 次 ,然后 返回 再 次 判断 逻辑 表达 式 是 否 为 真 。 在 反复 执行 时 ,每 次 都 要 
判断 。 若 逻辑 表达 式 为 假 , 则 终止 循环 。while 循环 的 一 般 形式 如 下 : 

while 逻辑 表达 式 1 

语句 1 
while 逻辑 表达 式 2 
语句 2 
end 

3. IF 分 支 结构 

焉 结构式 一 种 条 件 分 支 结构 ,判断 某 个 条 件 是 否 成 立 , 如 果 成 立 则 执行 结构 内 
的 语句 ,否则 就 跳出 ff 分 支 结 构 , 执 行 后 面 的 语句 。 其 基本 格式 如 下 : 


而 > 


让 表达 式 1 
语句 1 
else if 表达 式 2( 可 选 ) 
语句 2 
else (可 选 》 
语句 3 
end 
end 
站 语句 首先 判断 “表达 式 1 是否 成 立 , 如果“ 表达 式 1” 成 立 , 就 执行 语句 1, 否 
则 的 话 就 执行 else if 中 的 条 件 判断 (这 是 可 选项 )。 如 果 结 构 中 所 有 的 表达 式 都 不 
满足 ,就 跳出 执行 本 结构 后 面 的 语句 。 需 要 注意 的 是 ,每 个 if 都 对 应 一 个 end, 即 
有 几 个 让 ,就 应 有 几 个 end。 
[ 例 4-1] 编程 计算 下 列 函 数 的 值 : 


工 (z=0) 
,二 (0O<zrz<1) 
cosr (Z 之 1) 


function y=fenduan (x) 
if x<0 
y=x; 
else if x>=1 
y=cosx; 
else 
y 一 x 3; 
end 
end 
4. SWITCH 分 支 结构 
switch 结构 根据 表达 式 取 值 的 不 同 ,分 别 执行 不 同 的 语句 。 其 基本 格式 如 下 : 
switch 表达 式 
case 常量 表达 式 1 
语句 1 
case 常量 表达 式 2 
语句 2 


= 


otherwise 
语句 n 
end 
switch 结构 执行 时 ,程序 检查 表达 式 的 值 , 当 表达 式 的 值 等 于 case 表达 式 1 的 值 
时 ,执行 语句 1; 当 表达 式 的 值 等 于 case 表达 式 2 的 值 时 ,执行 语句 2; 后 面 以 此 类 
推 。 当 表达 式 不 等 于 case 所 列 出 的 所 有 表达 式 的 值 时 , 则 执行 otherwise 后 面 的 
语句 。 





第 五 节 MATLAB 在 线 帮助 


MATLAB 功能 强大 ,函数 齐全 ,指令 和 调用 方式 众多 。 为 了 帮助 用 户 了 解 
和 掌握 其 功能 ,MATLAB 通过 在 线 帮 助 功能 提供 帮助 。 常 用 获取 帮助 信息 的 指 
令 有 help、lookfor 以 及 帮助 浏览 窗 等 , help 指令 是 MATLAB 中 最 有 用 的 指令 
之 = 

1. 直接 使 用 help 指令 

可 以 获取 当前 电脑 上 MATLAB 的 分 类 列表 , 即 当前 安装 的 工具 箱 名 称 以 及 
其 简要 描述 。 

2. 函数 搜索 指令 

MALTAB 的 各 个 函数 ,不 管 是 内 建 函 数 .M 文件 函数 .还 是 MEX 文件 函数 
等 ,一 般 它们 都 有 M 文件 的 使 用 帮助 和 函数 功能 说 明 ,各 个 工具 箱 通常 情况 下 也 
具有 一 个 与 工具 箱 名 相同 的 M 文件 用 来 说 明 工具 箱 的 构成 内 容 等 。 在 MATLAB 
命令 窗口 中 ,可 以 通过 指令 来 获取 这 些 纯 文本 的 帮助 信息 。 . 

在 知道 某 具 体 函 数 指令 名 称 ,但 不 知道 该 函数 如 何 使 用 的 情况 下 ,可 以 用 函数 
搜索 指令 help。 使 用 help 函数 名 ,可 以 获得 该 函数 的 纯 文本 的 帮助 信息 ,通常 也 
带 有 少量 的 例子 。 例 如 ,我 们 想 知 道 求 极限 函数 LIMIT 的 用 法 ,在 命令 窗口 中 输 
人 help limit, 可 得 到 以 下 的 文字 说 明和 例子 。 

LIMIT Limit of an expression. 

LIMIT(F,x,a) takes the limit of the symbolic expression F as x—> a. 

LIMIT(F,a) uses findsym(F) as the independent variable. 

LIMIT(F) uses a 一 0 as the limit point. 

LIMIT(F,x,a,' right') or LIMIT(F, x,a,' left') specify the direction 

of a one— sided limit. 


Examples: 
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syms xath; 


limit(sin(x)/x) returns 1 
limit((x—2)/(x* 2 一 4) ,2) returns 1/4 
limit((1] 十 2x* t/x) (3x x),x,inf) returns exp(6x t) 
limit(1/x,x,0, right') returns inf 
limit(1/x,x,0, left') returns 一 inf 

limit( (sin(x+h)—sin(x))/h,h,0) returns cos(x) 
v=[(1 十 a/x)” x, exp(—x)]; 

limit(v, x,inf,' left') returns [exp(a)， 0] 


3. 词 条 搜索 指令 

在 理解 某 具 体 问 题 ,但 不 知道 有 哪些 函数 可 以 使 用 的 场合 ,可 以 用 词 条 搜索 指 
令 来 获取 帮助 。Lookfor 是 在 MATLAB 的 搜索 路 径 所 有 M 文件 的 第 一 个 注释 行 
(简称 Hl 行 ) 搜 索 特 定 关 键 字 。 而 docsearch 可 在 HTML 文件 构成 的 帮助 子 系统 
中 进行 多 词 条 检索 ,其 功能 等 同 于 下 一 节 帮 助 浏览 器 中 的 “Search 搜索 窗 ”, 它 的 搜 
索 功 能 强 ,效率 高 。 

例如 ,在 命令 窗口 输入 lookfor integration, 可 得 到 如 下 的 检索 结果 


cumtrapz - Cumulative trapezoidal numerical integration. 

trapz — Trapezoidal numerical integration. 

lotkademo - Numerical Integration of Differential Equations 
sfunmem -A one integration - step memory block S ~ function. 
hdlsettingsdspb - Helper function for DSP Builder integration 
hdlsettingsxsg — Helper function for System Generator integration 


如 果 想 知道 微分 方程 的 有 关内 容 , 可 在 命令 窗口 输入 

docsearch Differential Equation, 可 得 到 相关 搜索 结果 。 

4. 帮助 浏览 器 

帮助 浏览 器 的 内 容 来 源 于 所 有 M 文件 ,但 更 详细 。 它 的 界面 友善 方便。 这 
是 用 户 寻找 帮助 的 最 主要 资源 。 

在 运行 窗口 输入 helpbrowser 或 helpdesk, 便 会 弹出 帮助 浏览 器 的 界面 ,如 
图 4-2 所 示 。 

从 图 中 可 看 出 , 帮助 浏览 器 有 四 个 “导航 窗 ”, 分 别 是 内 容 分 类 目录 
(Contents) ,指令 检索 (Index) , 词 条 检索 (Search Results) 和 实例 演示 (Demos) 。 

目录 (Contents) 窗 理 出 节点 可 展开 的 目录 树 ,用 鼠标 单 击 目录 条 , 即 可 在 帮助 
浏览 器 的 内 容 显 示 窗 中 显示 相应 标题 的 HTML 帮助 文件 。 

MATLAB 事先 制作 了 指令 ` 函 数列 表 文 件 , 专 供 检索 (Index) 窗 口 使 用 。 用 户 
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图 4-2 帮助 浏览 器 界面 


在 Index 窗 上 方 的 输入 检索 词 (Enter Index Term) 中 输入 某 个 词 的 字母 时 ,显示 白 
板 就 列 出 与 键入 字母 最 匹配 的 词汇 列表 。 例 如 输入 “diff”, 显 示 的 结果 如 图 4 -3 


所 示 。 
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syntax 


newfts = difttoldfts) 
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| size compues me dmerences of the date sories in a finencial time :| 
| senes object tretuns another bme senes obyect containing me 4 
| arerence 


In the dala senes of the objectoldfts and retums the Tesutin the 
| object newtts newfts Isafinancial ime senes object containing 
the same data senes (names) asthe input oldfts 


| nevres = dict (oldtes) compuesthe diflerence ofalthe date 对 





See Also 
dif€ inthe MATLAB documentation 








图 4- 3 检索 窗 对 diff 词汇 的 搜索 结果 片段 


EY 


搜索 (Search) 窗 口 是 利 用 关键 词 查找 全 文中 与 之 最 匹配 章节 条 目的 交互 界 
面 。 与 Index 只 能 进行 单个 词汇 搜索 不 同 , Search 搜索 采用 多 词 条 的 逻辑 组 合 搜 
索 , 效 率 更 高 。 例 如 ,输入 “Differential Equation”, 可 查 到 如 图 4- 4 所 示 的 结果 。 





Parfial Differential E E 











图 4-4 搜索 窗 逻 辑 组合 搜 索 示例 


MATLAB 的 Demos 演示 系统 非常 丰富 。 它 以 算 例 为 切入 点 , 视 算 例 的 不 同 ,或 用 
M 文 件 ,视频 文件 或 GUI 图 形 用 户 界面 等 形式 来 表现 。 对 于 MATLAB 用 户 来 说 ,这 些 
演示 都 是 十 分 有 益 而 宝贵 的 资源 。 图 4- 5 所 示 的 是 二 维 画图 的 示例 演示 图 。 


aples of 2-0 line plots in ATLABe as well 
tting started. 


tips and tricks fer getting 





图 4-5 M 文件 演示 内 容 


EY 


本 章 学 习 要 点 : 
(1) 了 解 MATLAB 界面 。 
(2) 掌握 MATLAB 基本 语言 特点 。 


(3) 掌握 MATLAB 的 基本 运算 符 、 常 用 变量 的 使 用 。 


(4) 了 解 M 文件 的 编写 。 
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第 五 章 ” 非 线性 方程 的 数值 解法 


1 
十 
中 


非 线性 方程 f(z) 是 指 含有 变量 的 乘积 、 乘 方 或 变量 的 三 角 函 数 、 指 数 函 数 等 

的 代数 方程 或 超越 方程 。 如 代数 方程 
zz—I—l1l=0 
超越 方程 
e—7r=0 

求解 非 线 性 方程 /(x) = 0 是 工程 技术 上 经 常 遇 到 的 重要 数学 问题 ,对 于 4 次 以 下 
的 代数 方程 有 公式 解法 , 即 解析 法 ;但 对 于 4 次 以 上 的 高 次 方程 就 没有 公式 来 求 
解 ,而 对 于 超越 方程 就 更 没有 公式 求解 了 ,对 于 一 般 的 非 线性 方程 f(x) = 0 ,往往 
不 存在 根 的 解析 表达 式 。 本 章 主要 介绍 求解 非 线性 方程 的 几 种 数值 方法 。 

[ 例 5-1] 连续 搅拌 串联 反应 器 (CSTR) 是 由 若干 个 搅拌 釜 构成 的 反应 器 系 
统 , 物 料 连续 流动 。 假 定 该 反应 器 用 于 酶 催化 液 相反 应 ,并 已 知 关键 组 分 的 消耗 速 
率 一 ra 二 kX,kmol/(h。mi); 反 应 物流 量 V,m’/h; 进 料 摩尔 浓度 Co ，kmol/(h 。 
m’)。 对 任意 的 第 i 个 反应 签 作 关键 组 分 A 的 衡 算 有 


VCArb — VCaw — RCRaVi = 0 (i= 1,2,.,N) 
式 中 :Vi 为 第 i 个 签 的 反应 体积 ,m’?; N 为 反应 签 的 总 数 。 若 以 平均 停留 时 间 zt 二 
V/V 表示 A 的 衡 算式 , 则 上 式 可 变换 为 


Co + 起 C0 人 = 0 01, 2 N) (5.D) 


该 式 即 为 CSTR 反应 器 的 设计 方程 , 它 是 由 N 个 方程 构成 的 代数 方程 组 。 利 用 该 
方程 组 可 计算 如 下 两 类 问题 : 

(1) 已 知 反应 签 总 数 N ,计算 关键 组 分 A 的 浓度 分 布 Cso (一 1]，2，…，N)， 
即 求 每 个 反应 釜 的 进出 口 浓度 。 当 普 为 1 或 2 时 ,可 解析 求解 ,否则 用 数值 法 
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求解 。 
(2) 规定 最 后 一 个 反应 多 出 口 处 A 的 残留 浓度 Ciem , 求 算 所 需 的 反应 签 总 数 
N。 为 此 列 出 计算 方程 : 


f(N)=Chw—Cam 一 0 (5.2) 
式 中 :Caw 通 过 设计 方程 (5. 1) 递 推 求 算 , 即 


Caw ”CA 


=0 
kr kn 


Co 十 


Ck + -Ss =0, i=2,3,N 

方程 (5. 2) 需 用 数值 法 求解 。 

该 实例 说 明 , 许 多 实际 问题 的 计算 可 归结 为 求解 非 线 性 方程 f(x) = 0 的 问 
题 ,求解 方程 f(x) = 0 的 数值 法 的 基本 思想 是 从 某 个 初始 值 ze 出 发 ,按照 某 种 数 
值 过 程 模式 进行 重复 , 直至 达到 规定 的 精度 , 并 将 最 后 所 得 结果 z 作为 方程 
f(x) =0 的 数值 解 .显然 数值 解 是 满足 了 精度 要 求 的 近似 解 。 为 此 ,数值 法 必须 做 
三 件 事 : 首 先 在 函数 f(x) 的 定义 域内 寻找 初 值 zxo; 其 次 是 建立 逐次 逼近 的 数值 过 
程 模式 ;第 三 则 是 规定 最 终 近 似 解 的 精度 。 解 的 精度 取决 于 科学 计算 的 实际 要 求 而 
与 算法 无 关 。 各 种 算法 的 实质 是 由 数值 过 程 的 模式 确定 的 ,不 同 的 模式 具有 不 同 的 
计算 效果 和 速度 。 初 值 zo。 则 影响 计算 过 程 的 速度 甚至 成 败 。 因 此 下 面 几 节 将 分 别 
讨论 初 值 的 估计 以 及 几 种 适用 的 数值 过 程 模式 。 





第 二 节 初 值 估计 


非 线性 方程 f(x) = 0, 在 [a, 6] 内 有 多 个 根 时 ,必须 进行 根 的 隔离 ,寻找 单 根 
区 间 [Lai, b,j, i 二 1，2,*…, nn。 常 用 的 初 值 估计 或 根 隔离 的 方法 有 三 种 。 

(1) 物理 法 。 数 学 方程 f(x) = 0 来源 于 科学 计算 问题 ,因此 可 根据 科学 问题 
中 的 物理 概念 确定 初 值 .例如 ,在 计算 实际 气体 的 压缩 因子 Z 二 PV/RT 时 ,可 将 理 
想 气体 的 压缩 因子 Z。== 1 作为 初 值 , 即 Ze 二 PV/RT = 1。 

物理 法 估计 初 值 简便 而 确切 ,并 具有 明确 的 物理 概念 。 但 在 实际 应 用 上 有 一 
定 的 局 限 性 ,并 不 能 解决 所 有 初 值 的 估计 问题 ,有 许多 问题 的 初 值 估计 尚 须 借助 数 
学 法 。 

(2) 数学 法 。 数 学 上 实现 根 隔离 的 手段 主要 有 两 种 ,其 一 是 画图 法 ,其 二 是 列 
表 法 。 但 这 些 方法 均 有 其 局 限 性 ,无 法 在 计算 机 上 实现 。 





本 了 


(3) 计算 机 法 。 用 以 确定 初 值 或 根 根 所 在 区 间 的 常用 方法 有 图 解法 和 逐步 扫 
描 法 ,逐步 扫描 法 适 于 在 计算 机 上 实现 。 下 面 主要 讨论 逐步 扫描 法 。 

假定 非 线性 方程 f(z) = 0 在 [a, 6] 内 有 实 根 , 则 可 从 z= 二 a 出 发 , 按 某 个 选 定 
的 步 长 一步 步 地 增 大 x 的 值 ,每 增加 一 步 检查 一 下 这 一 步 两 端点 上 的 函数 值 是 否 
异 号 ,如 果 是 异 号 , 则 在 这 一 步 必 有 实 根 。 

[ 例 5-2] 设 方程 





f(z)=zr—r—l1=0 
因为 f(0) 过 0, f( 十 oo0) > 0, 所 以 这 个 方程 至 少 有 一 个 正 的 实 根 。 从 xz = 二 0 出 发 ， 
以 h 二 0. 5 为 步 长 向 右 进行 根 的 扫描 ,其 结果 见 表 5-1。 由 表 5-1 可 以 看 出 ,在 区 
间 [1.0, 1. 5] 上 至 少 有 一 个 实 根 。 





表 5-1 在 区 间 [0, 1.5] 内 f(x) 的 符号 变化 情况 









f(z) 的 符号 
在 应 用 这 种 方法 时 ,应 合理 选择 步 长 h。h 过 大 会 将 根 漏 掉 ,h 过 小 则 计算 步 又 
过 多 。 显 然 ,在 扫描 过 程 中 ,只 要 步 长 选 得 足够 小 ,就 可 以 直接 得 到 满足 一 定 精度 
的 根 的 近似 值 。 但 这 种 方法 是 不 可 取 的 。 一 般 来 说 , 根 的 扫描 只 要 获得 一 个 初 
始 近似 值 或 根 的 所 在 区 间 就 足够 了 ,至 于 根 的 进一步 精确 化 ,可 以 采用 别 的 
方法 。 
如 果 在 区 间 [a, 妇 内 有 唯一 实 根 , 则 可 用 两 分 法 求 取 足 够 准确 的 初 值 。 二 分 
法 的 基本 思想 是 通过 计算 隔 根 区 间 的 中 点 ,逐步 将 隔 根 区 间 缩 小 ,从 而 得 到 方程 
的 近似 根 。 设 在 区 间 [a, 5] 上 有 和 且 只 有 一 个 实 根 , 则 两 分 法 的 要 点 可 以 描述 
如 下 : 
_a+b 
(1) 取 z 一 2 


(2) 车 f(x) = 0, 则 工 即 为 根 ,过 程 结束 ; 
(3) 车 f(a)f(z) 一 0, 则 z=>b， 
车 f(b)f(z) 二 0, 则 zx 一 as 


(4) 车 |a 一 6| 之。, 则 过 程 结束 ,4 却 即 为 根 的 近似 值 (显然 已 满足 精度 要 
求 ) ,否则 从 (1) 开始 重复 执行 。 


求 得 初 值 或 找到 单 根 区 间 后 , 便 可 按照 规定 的 数值 过 程 模式 实现 逐次 逼近 ,使 
解 逐步 精确 化 , 解 方程 的 数值 过 程 模式 很 多 ,下 面 介绍 常见 而 又 重要 的 几 种 。 
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第 三 节 简单 迭代 法 


1. 和 迭代 思路 

和 迭代 法 是 求解 方程 f(x) = 0 的 最 基本 的 数值 方法 ,首先 将 方程 f(x) = 0 改写 
成 等 价 形式 :z = p(x) ,然后 将 初 值 ze 代入 上 式 右 端 , 则 求 得 zi 二 p(zo), 再 由 
又 可 求 得 x = p(x1),…，, 从 而 构造 出 近似 解 序列 zw == p(x,), 直到 满足 条 件 
| ze 一 Zz, | 过 6; 最 后 就 可 以 得 到 满足 精度 要 求 的 解 的 近似 值 zw 。 

下 面 举 一 个 例子 来 说 明 这 个 过 程 。 

[ 例 5-3] 已 知 方程 














z3 一 15z 十 14 一 0 
在 区 间 [ 一 2, 2] 上 有 实 根 ,用 简单 迭代 法 求 此 实 根 的 近似 值 ,精度 要 求 10“。 
把 原 方程 改写 成 如 下 等 价 形式 : 
T= (xz 二 14)/15 


在 此 ， gz) = (z+14)/15 
在 区 间 [ 一 2, 2] 上 任 取 一 点 zo, 现 取 ze 二 0。 然 后 ,根据 简单 迭代 格式 
Zr = (z+14)/15 
可 以 计算 出 近似 根 的 序列 如 表 5 - 2 所 示 。 
表 5- 2 简单 迭代 法 求解 过 程 






zh 一 (z3 十 14)/15 | ze —z,| 











0 0.933 33 0.933 33 
1 0. 933 33 0. 987 54 0. 054 21 
2 0. 987 54 0. 997 54 0.010 00 
3 0. 997 54 0. 999 51 0. 001 97 
4 0. 999 51 0. 999 90 0. 000 39 
5 0. 999 90 0. 999 98 0. 000 08 





由 表 5- 2 可 以 看 出 ,zs 与 xs 之 差 的 绝对 值 已 经 小 于 10“ ,因而 取 xs 作为 根 
的 近似 值 已 能 满足 预先 给 定 的 精度 要 求 , 即 取 


r= z= 0.99998~1.0000 
实际 上 ,该 方程 一 个 实 根 的 准确 值 为 x 二 1。 
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简单 迭代 法 比较 简单 ,容易 编制 计算 机 程序 ,但 任何 和 迭代 法 都 有 收敛 性 及 收敛 
快慢 的 问题 ,简单 迭代 法 也 不 例外 。 

2. 和 迭代 过 程 的 误差 与 收 剑 性 

上 面 令 述 了 简单 迭代 法 的 一 般 过 程 。 用 这 种 迭代 法 求 方程 f(x) 一 0 的 近似 
值 时 ,首先 需要 将 方程 f(x) = 0 改写 成 便于 迭代 的 等 价 形式 x 二 p(x) ,然后 用 
代 格 式 zw = (zw) 进行 迭代 计算 。 这 种 选 代 过 程 是 否 一 定 可 行 呢 ? 下 面 由 一 个 例 
子 来 说 明 这 个 问题 。 

[ 例 5-4] 已 知 方程 

了 2 十 z 一 6 一 0 (5.3) 


在 区 间 上 有 一 实 根 ,用 简单 迭代 法 求 此 根 的 近似 值 ,精度 要 求 为 10“。 
首先 将 方程 改写 成 如 下 等 价 形式 : 


工 一 6 一 也 
即 和 迭代 格式 为 
Zr 一 6 一 并 (5. 4) 
取 初 始 近似 值 xz。== 1, 利用 和 迭代 格式 可 以 计算 得 到 如 下 迭代 值 序列 
zo 一 1，z 一 5，za 一 一 19，z 一 一 355，… 








如 果 继 续 计 算 下 去 ,就 会 发 现 , 随 着 ”的 增 大 ,z, 的 绝对 值 越 来 越 大 ,根本 不 可 能 
满足 给 定 的 精度 要 求 。 

由 这 个 例子 可 以 看 出 ,利用 简单 迭代 格式 zl = g(x,) 计算 得 到 的 迭代 值 序 
列 m，zi，zz，…，z 并 不 一 定 收敛 于 诛 方程 的 根 。 为 了 说 明 这 个 问题 ,不 妨 先 来 
看 一 看 迭代 过 程 的 几何 解释 。 

求 方程 zx= p(x)(f(z) == 0 的 等 价 形式 ) 的 根 ,在 几何 上 可 以 归结 为 求 直 线 
y 一 工 与 曲线 y = p(x) 的 交点 的 横 坐 标 a, 如 图 5 - 1 所 示 。 

假设 初始 近似 值 zo。 是 曲线 y = p(x) 上 点 的 横 坐标 Au ，p(xzo) 就 是 点 的 纵 坐 
标 ;同时 ,水 平 直线 y = 9(zo) 与 直线 > 一 工 相交 于 点 Au ,其 横 坐 标 为 zi 一 p(xo)， 
算出 glzi) 就 得 到 y 二 p(xz) 上 的 点 Al, 它 的 纵 坐 标 为 [x1， g(x1)]。 如 此 继续 下 去 ， 
就 得 到 点 列 A。，Al ，A:,，…。 由 图 5- 1(a) 与 (b) 看 出 ,点 列 Ao， Ai ，A:，… 逐步 
通 近 A, 即 在 这 两 种 情形 下 ,和 迭代 过 程 是 收敛 的 。 由 图 5- 1(c) 与 (d) 看 出 ,点 列 A。， 
Ai,，A:，… 逐步 离开 A, 即 在 这 两 种 情形 下 ,迭代 过 程 是 发 散 的 。 

由 图 5- 1 可 知 ,和 迭代 过 程 的 收敛 性 与 曲线 的 形状 有 很 大 的 关系 。 那 么 ,究竟 
在 什么 情形 下 迭代 过 程 是 收敛 的 呢 ? 


= 

















图 5-1 简单 迭代 法 的 几何 解释 


假设 方程 f(x) = 0 的 根 为 x 二 a, 即 f(a) = 0 现在 将 方程 变 为 等 价 形式 后 , 显 
然 有 


a = 
再 根据 简单 迭代 格式 ,有 
Zo = gl) 

则 ”十 1 次 迭代 值 zm 与 根 a 的 差 为 

mn 一 < 二 gz) 一 Pa) 
再 根据 微分 中 值 定理 ,有 

EE 
式 中 :& 在 zx, 与 a 之 间 。 由 此 可 以 得 到 

l= Ee = lql (gq= p98)) 


为 了 保证 第 十 1 次 迭代 值 的 误差 与 第 ”次 迭代 值 的 误差 要 小 ,必须 要 求 


ey 4 二 


1p(91 一 1 
也 就 是 说 ,只 有 当 
lpg(®|= lal<1 


时 , 才 会 使 选 代 过 程 中 的 每 一 步 的 迭代 值 的 误差 绝对 值 越 来 越 小 , 且 趋 于 零 , 即 先 
代 过 程 收 僵 。 由 以 上 分 析 , 可 以 得 出 有 关 简 单 迭 代 法 收敛 性 的 如 下 结论 。 

设 f(x) = 0 满足 以 下 条 件 : 

(1) f(z) 在 [a, 5] 上 连续 ; 

(2) f(a)f(65) 二 0, f(z) 在 区 间 [a, 6b] 的 两 个 端点 上 的 函数 值 异 号 , 即 


f(b) 一 0 
(3) 方程 f(x) 的 等 价 形式 z = p(z) 在 [a, 5] 上 满足 
1p(z)[ 和 ll<1 
则 在 区 间 [a, 65] 上任 取 一 个 初 值 zo, 用 和 迭代 格式 
TH 一 p(Xn) 
计算 得 到 的 根 的 近似 值 序列 
Tos ZI 一 p(x0), Xz = PCTI)，…，xznrH = p(s) 


收敛 , 且 收 敛 于 方程 f(x) = 0 的 根 。 
上 述 条 件 (1) 与 (2) 保 证 方程 在 区 间 [a, 6] 上 有 实 根 。 
根据 上 述 有 关 收 敛 性 的 结论 ,对 于 例 5-4 中 的 方程 (5. 3) ,如 果 改 写成 男 一 种 
等 价 形式 : 
I 二 (6 二 37 一 zx?)/4 (5.5) 
则 可 以 得 到 如 下 迭代 格式 : 
efl = (6+ 3z, — x2)/4 (5.6) 


可 以 验证 ,此 时 的 gp(z) = (6 十 3 一 z?)/4 满 足 上 述 结论 中 的 条 件 (3) ,如 果 还 是 取 
初 值 z。= 1, 则 用 上 述 迭 代 格式 进行 迭代 计算 时 是 收敛 的 。 
第 四 节 ” 埃 特 金 迭 代 法 


以 上 对 迭代 过 程 中 的 误差 进行 了 分 析 , 得 到 了 使 简单 迭代 法 的 迭代 过 程 收敛 


Eo 


的 条 件 。 下 面 进一步 分 析 , 在 选 代 收 敛 的 前 提 下 ,如 何 进一步 加 速 迁 代 过 程 ,减少 
迁 代 次 数 。 
在 迭代 过 程 中 ,前 后 两 次 迭代 值 误差 之 比 为 


HL 一 4 一 9 (5.7) 


式 中 :a 为 方程 f(x) = 0 的 根 的 准确 值 , g 二 g(&), & 在 zx, 与 a 之 间 。 由 式 (5.7) 可 
以 得 到 方程 根 的 准确 值 : 
a = z+T or — 7,) (5. 8) 
9 
但 在 实际 的 迭代 过 程 中 ,z,+; 是 用 x, 来 计算 的 ,并 且 gq = Y (6) 也 无 法 确定 ,因此 ， 
不 可 能 用 式 (5. 8) 计 算出 根 的 准确 值 。 在 实际 进行 迭代 计算 时 ,往往 采用 如 下 的 迭 
代 格 式 : 





Th = G(r1), q= p(Tin) 
(5.9) 


Teh = Tt +r — x) 
1=yg 


式 (5.9) 表 明 , 先 用 第 n 次 的 迭代 值 x, 计算 一 个 初步 的 第 十 1 次 的 迭代 值 
Zi+1( 利 用 迭代 格式 ), 并 且 用 zx;+1 计 算出 9; 然 后 再 用 两 次 的 迭代 值 (zi+: 与 mw) 之 
差 来 进行 补偿 。 这 样 ,虽然 每 次 迭代 的 计算 工作 量 看 来 是 增加 了 ,但 是 由 于 迭代 次 
数 大 大 减少 ,整个 迭代 过 程 加 速 了 ,因此 ,总 的 计算 工作 量 会 减少 。 从 整体 考虑 ,这 
种 方案 往往 是 划算 的 。 

但 是 ,上 述 的 加 速 方案 有 一 个 缺点 。 在 用 式 (5. 9) 进 行 迭 代 计 算 时 ,除了 需要 计 
算 函 数值 pg(z) 以 外 ,还 涉及 其 导数 值 w(z) 的 计算 ,在 实际 使 用 时 很 不 方便 。 因 此 ， 
在 实际 使 用 中 ,对 上 述 加 速 迭 代 方案 作 了 一 些 改进 ,以 避免 导数 值 g(z) 的 计算 。 

设 


TH 一 pT), Tl = pT) 
由 式 (5.7) 有 


Zet 一 4 
了 一 毕 





= g(&) 
Za 
a PC) 


Tn 


因为 (6 ) 一 g(&), 所 以 


+ 


由 此 解 出 
人 
ZH 27 十 S0102 
显然 ,在 式 (5. 10) 中 已 不 再 包含 p(x) 的 导数 值 ,但 是 需要 用 两 次 迭代 值 进 行 计算 。 
综 上 所 述 ,可 以 得 到 迭代 计算 公式 如 下 : 


a TI 一 


预报 : zz 一 g(x) | (5. 11) 

校正 : zf 一 PCZri) (5. 12) 
人 

改进 : zon 一 zi 一 一 cz 一 za) (5. 13) 


对 1 一 2zaH 十 Zn 
用 式 (5. 11)、(5. 12) 与 (5. 13) 进 行 迭 代 的 过 程 称 为 埃 特 金 迭 代 法 。 
埃 特 金 迭代 法 具有 良好 的 收敛 性 。 有 时 ,一 个 不 收敛 的 迭代 格式 经 埃 特 金 迭 
代 法 处 理 后 也 有 可 能 变 为 收敛。 
在 例 5 - 4 中 已 经 指出 ,对 于 方程 (5. 3) 的 迭代 格式 (5. 4) 是 发 散 的 。 现 在 用 埃 
特 金 迭代 法 对 和 迭代 格式 (5. 4) 进 行 处 理 , 即 得 埃 特 金 迭代 格式 如 下 : 
(zi — Xl) 


Terl 一 ZH 一 一 9 
3 一 2zo 十 To 


仍然 取 初 值 x。= 1, 计算 结果 如 表 5 - 3 所 示 。 
表 5- 3 ” 埃 特 金 迁 代 法 计算 过 程 






Trt 








0 1.0 5.0 一 19.0 | 1.5714 
和 1.5714 3.5306 一 6.465 2 | 1.8925 
2 1.8925 2.418 4 0.1511 | 1.9915 
3 1.9915 2.0338 1.8636 | 1.9999 
4 1.9999 2.0002 1.9991 | 2. 000 
5 2. 000 2. 000 2. 000 | 








由 表 5- 3 可 以 看 出 ,经 过 5 次 迭代 就 得 到 了 很 精 确 的 一 个 实 根 x 二 2。 
在 使 用 埃 特 金 迭 代 法 时 ,必须 注意 控制 迁 代 的 条 件 应 为 


2 .| 
I 一 ThH | <E 


以 避免 在 用 式 (5. 13) 计 算 时 出 现 分 母 为 零 的 情况 。 
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第 五 节 牛 顿 法 


简单 迭代 法 是 用 直接 的 方法 从 原 方程 中 隐 含 地 解 出 工 ,从 而 确定 出 PC(z); 而 牛 
顿 法 用 一 种 间接 而 特殊 的 方法 来 确定 g(x) 。 

1. 选 代 格式 

当 导 数 f(z) 易 得 且 zo 估计 较 准 时 ,一 般 选 用 牛顿 法 ,对 函数 f(z) 在 zo 处 作 
泰勒 展开 ， 


jz) = fz) + fr) tr) rt) 


若 只 取 前 二 项 , 则 得 线性 函数 为 
jz) fro) tf (ro)(r—zo) 一 0 
解 得 : 
(xo) 


立 一 Zo 一 


(xo) 
从 而 构成 迭代 格式 : 


(zu) 
(zn) 


wetH 二 Tn 


2 收敛 性 

对 于 牛顿 迭代 法 的 收敛 性 ,有 如 下 结论 。 

设 方程 f(x) = 0 满足 下 列 条 件 : 

(1) f(z) 在 闭 区 间 [a, 5]J 上 ,f(zx) 与 (x) 均 存在 , 且 各 自 保持 一 定 的 符号 ; 

(2) f(a) f(b) 一 0; 

(3) f(xz)f (zr)>0 zo, TE La, b]; 

则 方程 f(x) = 0 在 区 间 [a, 5] 上 有 且 只 有 一 个 实 根 ,由 牛顿 迭代 格式 计算 得 
到 的 序列 zo， zl1，x2，…， zs 收敛 于 方程 fFCz) = 0 的 根 。 

下 面 分 两 种 情形 来 解释 牛顿 迭代 法 的 收敛 性 。 

第 一 种 情形 :了 (z) 与 fa) 同 号 ,如 图 5- 2(a) 与 (b) 所 示 。 从 A 点 引 一 切线 ， 
切线 方程 为 





3 一 ao) 十 记 (aCz 一 a) 


恒生 





/n>0 
/b>0 a, 





Mn<0 
fbD)<0 






S|-----p> 


{©) (d) B 
图 5-2 牛顿 迭代 法 的 几何 解释 
该 切线 与 + 轴 的 交点 为 x1( 令 y 二 0 即 可 解 出 ), 即 


0 
TI=a FD 
再 在 曲线 y = f(x) 上 横 坐 标 为 zi 的 Ai 点 作 切 线 , 该 切线 与 工 轴 的 交点 zs 为 
,fr) 
el (xz1) 


如 此 则 可 求 出 zz。 继 续 作 下 去 ,在 曲线 y 二 f(x) 上 便 得 到 点 列 A, Al, A;,…, 同 
时 ,在 z 轴 上 得 到 点 列 zo 一 a, xz1， zz，*…，, 它们 将 同时 趋向 于 曲线 y = f(x) 与 
工 轴 的 交点 工 二 a。 

在 这 种 情形 下 ,如 果 一 开始 在 B 点 作 切 线 , 则 该 切线 与 zx 轴 的 交点 可 能 已 超 
区 间 [a, 纺 ,将 有 可 能 导致 发 散 或 者 收敛 很 慢 。 

第 二 种 情形 : A(z) 与 (5) 同 号 ,如 图 5-2(c) 与 (d) 所 示 。 

作法 与 第 一 种 情形 相同 ,只 是 在 这 种 情形 下 ,从 B 点 开始 作 切 线 , 这 样 ,在 曲线 
y 三 f(x) 上 得 到 点 列 B, Bi1，B,,…, 同 时 ,在 + 轴 上 得 到 点 列 xo 一 b， zi，zz，…， 


:3 





加 次 过 


它们 也 将 同时 趋向 于 曲线 y = f(x) 与 + 轴 的 交点 x 二 a。 
同样 ,在 这 种 情形 下 ,如果 一 开始 从 A 点 作 切 线 , 也 将 可 能 导致 发 散 或 者 收敛 
很 慢 。 
由 此 可 知 ,牛顿 法 的 几何 意义 是 用 一 系列 切线 与 zx 轴 的 交点 来 逐渐 逼近 曲线 
y 三 f(x) 与 x+ 轴 的 交点 。 因 此 牛顿 法 也 叫 切 线 法 。 
[ 例 5-5] 已 知 甲苯 胺 的 饱和 鞘 气压 计算 式 为 
lgP = 23.8296 一 3480.3/T 一 5.08llg 工 


式 中 :P 为 压力 ,kPa; T 为 温度 ,K。 试 求 已 = 101. 31 kPa 下 的 沸点 。 
为 了 计算 一 定 压力 下 的 沸点 ,可 将 蒸气 压 计算 式 及 其 导数 表达 式 写成 
f(T) = 23.8296—lgP—3480.3/T—5.081llg T= 0 
f(T) = 3480. 3/T2? —2.207/T 


为 了 获得 初 值 Tu ,可 画 出 函数 略图 。 若 按 通常 的 数学 方法 作 图 ,显然 该 方程 
在 [0, oo] 内 有 两 个 根 ,其 中 一 个 根 存在 于 区 间 [400, 500] 内 , 取 Tu = 500K, 和 迭代 
4 次 可 求 得 工 = 406. 1995K; 另 一 个 根 存在 于 区 间 [1 000, 15 000] 内 ,此 根 无 物理 
意义 。 可 见 , 进 行 实际 计算 时 ,必须 事先 进行 根 隔离 , 找 出 隔 根 区 间 , 以 选择 合理 初 
值 。 在 事后 还 必须 对 所 得 结果 进行 分 析 , 这 样 才能 获得 合乎 实际 的 合理 性 答案 。 











第 六 节 插 值 法 


1. 迭代 格式 

当 函 数 f(z) 的 导数 广 (z) 不 易 求 得 时 , 则 可 采用 插值 法 解 方程 f(x) = 0。 其 
基本 思想 与 牛顿 法 相似 ,即将 非 线 性 函数 有 (z) 线 性 化 ,而 后 求解 ,但 两 者 的 差别 在 
于 后 者 用 导数 , 即 用 某 点 的 切线 ,而 前 者 则 用 差 商 们 瑟 二 人 全 或 全 一 人 人 2， 


即 两 点 间 的 割 线 , 就 得 到 如 下 的 和 迭代 格式 : 


wb 


2 — f(s 一 0 

ee i 

a G(s 6) 

或 0 一) 


2. 收敛 性 
对 于 插值 法 的 收敛 性 ,有 如 下 结论 。 


ws 


设 方程 f(x) = 0 满足 下 列 条 件 : 
(1) f(z) 在 闭 区 间 [a, 6] 上 ,了 (z) 与 六 (x) 均 存 在 , 且 各 自 保持 一 定 的 符号 ; 
(2) f(b) < 0; 
(3) 车 了 (xz) 了 (x) > 0; 则 取 zo = a, 和 迭代 格式 为 
二 
zc 一 天) 
(4) 若 PCz) PCz) 二 0; 则 取 zo 二 5, 迭代 格式 为 


= » Hx) (x, —a) 
TorH Tn flzxs) — fla) 


则 方程 f(x) = 0 在 区 间 [a, 5] 上 有 且 只 有 一 个 实 根 ,由 以 上 迄 代 格 式 计算 得 到 的 
序列 zo， xz，xz，…，xn 收敛 于 方程 f(x) 二 0 的 根 。 
下 面 分 两 种 情形 来 解释 插值 法 的 收敛 性 。 
第 一 种 情形 :在 区 间 [a, 外 上 ,了 f(z) 与 了 (zx) 同 号 ,如 图 5-3(a) 与 (b) 所 示 。 
过 A 与 B 两 点 作 弦 AB, 其 方程 为 
2 一 Fa) _ f(0)— fla) 


0 区 一直 
不 难 解 出 该 弦 与 x 轴 的 交点 为 x1( 令 y 二 0 即 可 解 出 ), 即 


ZIl 一 4 一 Fe ef 


在 曲线 y = f(x) 上 横 坐 标 为 zi 的 点 为 Ai 。 再 过 Ai 与 BB 作 弦 A1B, 弦 A1B 
与 x 轴 的 交点 xs 为 


—b 
XZ = 1 Ff) 
如 此 则 可 求 出 xz。 曲线 y = f(x) 上 横 坐 标 为 zs 的 点 为 As 。 继 续 作 下 去 ,在 曲线 
y 三 /rz) 上 便 得 到 点 列 A，A，A:，…, 同 时 ,在 工 轴 上 得 到 点 列 re 一 a，zi， 
2 它们 将 同时 趋向 于 曲线 y 二 f(z) 与 + 轴 的 交点 x 二 a。 在 这 种 情 
形 下 ,如 果 取 初 值 zo。 = a, 则 用 迭代 格式 : 
mn RB 


计算 得 到 的 点 列 zo 一 a, xi， zx2，…， Xs，"…, 将 收敛 于 方程 f(x) 二 0 的 根 。 
第 二 种 情形 :在 区 间 [a, 5] 上 ,了 (x) 与 六 (zx) 异 号 ,如 图 5-3(c) 与 (d) 所 示 。 


> 






/7)>0 
1"(D)>0 


--------™m 





/0 

: /1"(7)>0 

| 

1 加 m=b 
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(d) 

图 5-3 插值 法 的 几何 解释 
过 A 与 BB 两 点 作 弦 AB, 其 方程 为 

3—f(a) _ f(6)— fla) 

叶 二 过 b—a 
2 b—a 

z=b FO = fea 

同样 可 以 解 出 该 弦 与 工 轴 的 交点 为 xi:( 令 ?一 0 即 可 解 出 ), 即 
在 曲线 y = f(z) 上 横 坐 标 为 zi 的 点 为 Bl 。 再 过 人 A 与 B; 作 弦 ABi, 弦 ABi 

与 工 轴 的 交点 zs 为 


T= 一 Ff) 


曲线 y 二 f(z) 上 横 坐 标 为 zs 的 点 为 B; .继续 作 下 去 ,在 曲线 y = f(x) 上 便 得 到 
点 列 B， Bl， Bs,…, 同 时 ,在 + 轴 上 得 到 点 列 zo 二 65, ,zz，*…， x,，…, 它 们 将 
同时 趋向 于 曲线 y= 二 f(x) 与 + 轴 的 交点 x 二 a, 在 这 种 情形 下 ,如 果 取 初 值 zo。 二。， 


=69> 


则 用 迭代 格式 : 


。 a 
et fea/ ) 


计算 得 到 的 点 列 zo 一 5， xz， Zz2，*…， za，…, 将 收敛 于 方程 f(x) = 0 的 根 。 

由 上 述 两 种 情形 的 讨论 可 知 , 插 值 法 的 几何 意义 是 用 一 系列 弦 与 x 轴 的 交点 
来 逐渐 冰 近 曲线 y = f(x) 与 工 轴 的 交点 。 因 此 插值 法 也 叫 弦 切 法 或 弦 割 法 。 

[ 例 5-6] 应 用 插值 法 求解 R-K 方 程 ,以 质量 体积 表示 的 R-K 方程 为 


Fo) = RT—(—WDLIP+a/T iv(vy+b)]=0 


式 中 : a = 0. 427 8R?*T?5/P., b = 0. 086 7RT./P. 。 
可 取 理 想 气体 状态 方程 的 质量 体积 w = RT/P 为 一 个 初 值 , 另 一 个 初 值 ww 可 
用 计算 机 法 寻找 。 即 由 vo 出 发 , 按 选 定 的 步 长 &, 从 小 向 大 逐步 搜索 ,直到 


Fu) 十 h) 一 0 
为 止 。 这 时 取 
w= 二 Uw Um 二 wo 十 hh 
例如 对 N; 而 言 ， 
Wo =Vos Un 二 vo 十 h 
T.=126.2K, P.= 33.5atm?, R= 82.06 
若 求 273 K 和 1 000 atm 下 的 质量 体积 , 取 e = 10“, 则 和 迭代 7 次 可 得 。 与 牛顿 法 
的 和 欠 代 次 数 大 致 相同 。 
应 当 特 别 指出 ,由 于 插值 法 在 每 次 迁 代 中 调用 函数 子 程序 只 1 次 ,又 不 需要 导 
数 ,特别 适合 于 求解 [ 例 5 - 1] 中 第 二 类 那样 的 复杂 问题 , 即 函 数值 f(x) 的 计算 过 
程 宛 长 的 问题 。 


第 七 节 ”用 MATLAB 求解 非 线性 方程 


1. 直接 求解 
MATLAB 的 优化 工具 箱 中 提供 了 两 个 求解 非 线 性 方程 的 函数 fzero 和 


@ atm( 标 准 大 气压 ) = 101 325 Pa, 下 同 。 


= I= 


fsolve。 用 它们 来 求解 非 线 性 方程 的 根 十 分 方便 。 下 面 就 这 两 个 函数 的 调用 作 简 
单 介 绍 。 
函数 fzero 的 调用 格式 为 


b= fzero( F",zvtol,trace) 


fzero 是 寻找 单 变量 函数 f(x) 的 一 零 值 点 。F 是 f(z) 的 名 称 ,x 是 初始 估计 
值 。 返 回 的 值 是 靠近 点 , f(x) = 二 0 时 的 横 坐 标 x+ 值 ,搜寻 失败 返回 NAN。 其 依 
据 是 邻近 这 一 点 ,函数 f(x) 的 值 反 号 。 若 为 二 维 向 量 ,并 符合 F[(xi)]、 
F[(zz)] 反 号 的 条 件 ,函数 返回 值 为 该 区 间 内 的 零点 。tol 为 设置 收敛 判断 的 相对 
误差 。trace 不 为 零 时 ,将 显示 中 间 结 果 。tol、trace 取 默 认 值 时 输入 空 矩阵 。 

[ 例 S-7] 求解 coszx = 0 在 x = 2 附近 的 解 。 


在 MATLAB 命令 窗口 内 输入 
fzero(@cos,2) 
ans 一 
1. 5708 
若 想 知道 求解 过 程 ,可 以 输入 
>>fzero(@cos,2,optimset(' disp',' iter')) 
Func-count 人 f(x) Procedure 
1 2 一 0. 416147 initial 
2 1.94343 一 0. 364071 search 
3 2.05657 一 0. 466891 Search 
4 1. 92 一 0. 34215 search 
5 2.08 一 0. 487482 search 
6 1. 88686 一 0. 31083 search 
7 2.11314 一 0. 516142 search 
8 1.84 一 0. 265964 search 
9 2.16 一 0. 555699 search 
10 1.77373 一 0. 20154 search 
11 2. 22627 一 0. 609538 search 
12 1. 68 一 0. 108987 search 
13 2. 32 一 0. 681056 search 
14 1. 54745 0. 0233425 search 


yh 


Looking for a zero in the interval [1. 5475, 2. 32] 


15 1. 57305 一 0. 00225625 interpolation 
16 1. 5708 1. 85136e 一 007 interpolation 
17 1. 5708 一 1.57146e 一 013 interpolation 
18 1. 5708 6. 12323e 一 017 interpolation 
19 1. 5708 一 6. 04901le 一 016 interpolation 


Zero found in the interval: [1. 5475, 2. 32]. 
ans 一 


1. 5708 


根据 不 同 计算 的 需要 ,fslove 函数 有 多 种 调用 格式 可 供 选 用 , 现 以 最 常见 的 格 

式 为 例 说 明 。 
b = fslove(C F', x0,options) 

式 中 :F 为 函数 名 ,x0 为 初 值 矩 阵 ,options 为 以 向 量 表示 的 可 选 参 数值 。 需 要 注意 
的 是 如 果 在 某 区 间 有 两 个 以 上 根 ,使 用 fslove 效果 较 好 ,而 fzero 只 能 得 到 单 根 。 

2. 迭代 法 求解 

MATLAB 没有 专门 用 于 非 线性 方程 迭代 法 求解 的 函数 ,因此 用 和 迭代 法 求解 
时 ,要 事先 编写 相应 迭代 法 的 M 文件 。 下 面 以 牛顿 迭代 法 为 例 说 明 。 

newton. m 

function y=Newton( x0) 

x]=x0—fc(x0)/df(x0); %fc 为 原 函 数 ,df 为 导 函 数 

k=1; 

while (abs(xl 一 x0) 之 一 1. 0e 一 5)&(k< 二 1000000) ”% 精 度 和 和 迭代 次 数控 制 

x0 一 Xl; 

xl 一 x0 一 fc(x0)/df(x0); k 一 k 十 1; 

end 

xl 

k 

应 用 前 先 要 编写 原 函 数 和 导 函 数 的 M 文件 。 

[ 例 5-8] 求 例 5- 5 给 出 的 方程 。 

首先 编写 M 文件 。 

fc. m 

function y=fc(x) 

y=23. 8296 一 3480. 7/x 一 5. 081 * logl0(x)—log10(101. 31); 


Ey 


df.m 
function y=df(x) 
y=3480. 3/x. “2 一 2. 207/x; 


当初 值 选 为 500 时 ,在 MATLAB 命令 窗口 输入 : 


>>>newton(500) 
说 一 
406. 1995 
k= 
5 


本 章 学 习 要 点 : 

(1) 了 解 迭 代 法 的 基本 格式 和 收敛 条 件 。 
(2) 运用 迭代 法 牛顿 法 求 根 。 

(3) 了 解 和 练习 fzero 和 fsolve。 


ee 


第 六 章 ”线性 方程 组 的 数值 解法 


1 
十 
岂 
惠 


解 线性 方程 组 AX 一 B 是 数值 计算 中 的 一 项 基本 运算 ,有 许多 数值 过 程 涉 及 
解 线性 方程 组 的 问题 ,如 非 线 性 方程 组 的 求解 .曲线 的 最 小 二 乘法 拟 合 、 三 次 样 条 
插值 .微分 方程 的 差分 解法 等 。 另 外 ,许多 问题 的 计算 中 也 往往 直接 或 间接 地 涉及 
解 线性 方程 组 的 问题 。 例 如 , 某 些 生化 工程 的 模型 本 身 就 是 线性 方程 组 , 见 例 
6 - 1; 而 另 一 些 生命 科 学 模型 则 涉及 解 非 线性 方程 组 。 

[ 例 6-1] 多 组 分 混合 物 的 光谱 分 析 。 按 照 比尔 定律 ,一 定 波长 4 下 物质 的 
吸光 度 巨 与 其 浓度 C 的 关系 为 

E=é&LC= mC 


式 中 :& 为 物质 的 摩尔 吸光 度 ,L 为 试 样 厚度 , mu = &L。 由 于 & 不 但 与 物质 性 质 
有 关 , 而 且 还 与 波长 + 有关, 因此 乘积 m 与 物质 性 质 和 波长 有关 。 如 果 比 尔 定 
律 适用 于 元 混合 物 ,那么 在 波长 + 下 有 


一 FM, 
为 了 确定 元 混合 物 中 各 组 分 的 含量 ,在 个 波长 ,Ci 二 1,2，…,n) 下 ,测定 


混合 物 的 吸收 率 EE (i 二 1，2，…, nn)，, 按照 比尔 定律 有 


Es = mC + mC tmaCs t+ mC,, 
Ey = maCi tm + maCs + manC, 


E, = manC Fm 十 maCs 十 … 十 mmC。 
对 于 不 同 波长 下 各 种 物质 的 摩尔 吸收 率 & 可 在 手册 中 查 得 。 当 试 样 厚度 工 确定 
后 , m 便 为 定 值 。 将 测定 数据 代入 上 述 方程 组 便 可 获得 一 个 n 阶 方程 组 , 解 之 便 
可 求 得 各 物质 的 浓度 Ci， Cz，…，C,。 
在 实际 问题 和 数值 计算 中 产生 的 线性 方程 组 AX=B, A 大 致 有 三 类 :一 类 是 


es 


低 阶 稠密 和 矩阵 ( 阶 数 小 于 或 等 于 150); 二 类 是 大 型 稀 朴 矩阵 (和 矩阵 中 零 元 素 较 多 )， 
三 类 是 三 对 角 和 矩阵 ( 非 零 元 素 集中 于 主 对 角 线 及 相 邻 两 对 角 线 上 ) 。 
在 线性 代数 中 ,已 知 解 线性 方程 组 的 克 莱 姆 (Cramer) 法 则 , 即 线性 方程 组 
AX 一 B, 当 它 的 系数 行列 式 det4 尖 0 时 ,方程 组 有 唯一 解 : 
X=A'B 


对 于 实际 问题 ,方程 组 的 维 数 往往 比 10 要 大 得 多 , 且 不 管 舍 人 误差 对 计算 结 
果 的 影响 ,采用 精确 计算 的 计算 量 太 大 ,使 它 失去 了 使 用 价值 。 故 需要 采用 数值 法 
进行 线性 代数 方程 组 的 求解 。 

线性 方程 组 的 数值 解 可 分 为 直接 法 和 迭代 法 两 种 ,下 面 分 别 给 予 讨论 。 


第 二 节 ” 解 线性 方程 组 的 直接 法 


所 谓 直 接 法 即 消 去 法 ,是 经 过 有 限 步 的 算术 运算 以 求 得 方程 组 的 解 , 如 在 运算 
过 程 中 无 舍 人 误差 , 则 求 得 的 是 精确 解 ,但 实际 上 由 于 计算 机 有 效 位 数 的 限制 , 运 
算 过 程 中 必 有 伟人 误差 , 求 得 的 也 仅仅 是 近似 解 。 

直接 法 解 线性 方程 组 AX 一 四 就 是 对 矩阵 4 和 列 向 量 B 进行 有 限 次 的 运算 ， 
为 此 应 对 A 和 B 的 某 些 运算 性 质 有 个 基本 了 解 。 和 矩阵 4 是 按 一 定格 式 排列 的 mm X 
7 个 实数 的 集合 , 即 


思 Sis | 
i se pd 


mXn 表示 和 矩阵 A 有 m 行 和 n 列 , 可 用 A = (a5) (i=1,2, ,mm;j 二 1,2,…， 
n) 来 简单 表示 ,车 m = nn, 则 A 为 方 阵 。 

如 果 两 矩阵 中 的 元 素 对 应 相等 , a; 二 cj(i 二 1,2,…,m;j 二 1,2, ,nn)， 
则 称 该 两 矩阵 对 应 相等 。 记 作 4 一 C。 两 矩阵 之 积 5 二 AC, S 矩阵 中 各 元 素 为 


可 一 Dau ci (一 1 2 7203 一 1，2， 7 
t= 


一 般 说 来 , 4AC 隆 C4 ,但 4(CD) = (4C)D。 所 谓 A 的 转 置 就 是 行 与 列 的 对 换 , 即 AT 
的 行 即 为 4 的 列 , 例 如 , 47 二 C, 则 cj = aj。 可见, 列 向 量 B 可 以 行 向 量 的 转 置 表 
示 , B 二 (各 ，2，…，b) 。 乘 的 转 置 为 转 置 矩阵 的 积 ,但 要 交换 相 乘 的 顺序 ， 
(4B)' = BI4T。 


在 直接 法 解 4X 一 中 中 还 要 涉及 一 些 特殊 的 矩阵 ,如 对 角 阵 : 


1 0] 
D= | 和 = diag(di, d;, *…, d,) 
0 dn wn 


也 就 是 除 对 角 线 上 的 元 素 外 ,其 余 均 为 零 。 特 别 如 单位 矩阵 , 工 = diag(1, 1,…， 
Fb 
三 角 和 矩阵 可 分 为 下 三 角 阵 L 和 上 三 角 阵 U, 其 形式 分 别 为 : 


ly 01 WU on 
L= | es | U= < -各 
Se Lo Um 


三 角 阵 的 和 、 积 和 逆 仍 是 同类 型 的 三 角 和 矩阵 。 

若 方 阵 的 行列 式 det(4) 天 0, 则 称 4 为 非 奇 异 的 。 对 于 非 奇异 的 方 阵 4, 存在 
着 一 个 逆 和 矩阵 A“! ,两 者 之 间 的 关系 为 A 4 一 44- 一 工 

当 A==4' 时 ,和 矩阵 A 对 称 ,其 特征 是 以 主 对 角 线 为 中 轴 , 和 矩阵 4 中 各 元 素 对 应 
相等 , 即 w = ai 一 1， 2,…, n; j= 三 1，2,…,n); 如 果 4 是 实 方 阵 , 且 
474 = 则 称 4 为 正 交 矩 阵 。 当 4 为 正 交 和 矩阵 时 , 47 一 4 。 

由 线性 代数 知 ,矩阵 的 初等 变换 定义 如 下 : 

对 矩阵 的 行进 行 下 列 三 种 变换 , 称 为 矩阵 的 初等 行 变换 。 

(1) 交换 矩阵 的 任意 两 行 。 

(2) 用 一 个 非 零 常数 乘 矩 阵 的 任意 一 行 的 每 个 元 素 。 

(3) 把 矩阵 的 第 i 行 的 某 个 元 素 加 上 第 j 行 的 对 应 元 素 的 & 倍 。 

若 把 上 述 定义 中 的 行 换 成 列 ,就 成 为 矩阵 的 三 种 初等 列 变换 ;矩阵 的 初等 行 变 
换 和 初等 列 变换 统称 为 矩阵 的 初等 变换 。 

1， 高 斯 (Guass) 消 去 法 

高 斯 消去 法 是 直接 法 中 最 常用 、 最 有 效 的 方法 之 一 。 其 基本 思想 就 是 逐次 消 
去 一 个 未 知 数 , 使 方程 4AX=B 变换 成 一 个 等 价 的 三 角形 方程 组 ,然后 再 通过 回 代 
求 得 向 量 X。 这 里 先 对 一 般 三 角形 方程 组 求解 情况 做 一 介绍 。 

对 于 上 三 角 线 性 方程 组 : 


ES 


可 由 后 向 前 逐一 求解 。 对 第 ”个 方程 : z, 一 umn /um。 对 第 i 个 方程 
Xi 一 (zinH 一 > (i=n—l1,n—2,., 1) 
krtl 


这 种 由 后 向 前 逐个 求解 的 方法 称 作 回 代 。 
对 于 下 三 角 线性 方程 组 : 


Un 0] [#1 [hint 
Lan 


la lz 旧 = 
a “be: wi lm 四 | 


则 可 由 前 向 后 逐个 求解 ,zi 二 Lnn /Ln。 对 第 i 个 方程 : 








和 1 
Ti= an — Dlari/ls 一 2 一 1, 7 一 2，…，1) 
k=l 


只 要 ui 天 0, li 闫 0, 这 种 计算 总 是 成 功 的 。 对 实际 过 程 中 产生 的 线性 方程 组 
适当 排列 ,有 可 能 出 现 上 述 两 种 简单 情形 。 如 果 一 般 线性 方程 组 经 适当 运算 ,使 其 
变 为 上 三 角 线 性 方程 组 , 则 不 难 用 回 代 法 求解 。 高 斯 消去 法 就 是 利用 矩阵 初等 变 
换 , 将 nn 阶 线性 方程 组 变 为 等 价 的 单位 上 三 角 线 性 方程 组 。 如 对 一 般 的 线性 方程 
组 AX = B, 高 斯 消去 法 大 致 按 以 下 两 步 进 行 。 

将 系数 矩阵 A 和 常数 向 量 写作 增 广 矩 阵 ,经 过 一 系列 的 初等 行 变换 变 成 三 
角 和 矩阵 ,其 也 同时 参与 变换 , 即 

au … an bl] [fl … an 6 
Qa … aa b: | 0 … am pz 


Oo … am bn 0 … am bj 


在 变换 过 程 中 ,采用 原 地 工作 , 即 经 变换 后 的 元 素 仍 放 在 原来 的 位 置 上 。 
假设 对 于 任意 的 上 有 au 天 0, 则 进行 回 代 ,依次 解 出 ,1，…， Xs， Zz。 
(1) 直接 解 出 xz, , 即 


如 /am 一 Tv 


(2) 进行 回 代 : 


太一 2 ayzj=z: (一 1 一 1]， 7 一 2，…，1) 
j=itl 


Ey 


另外 ,在 消去 过 程 中 ,要 用 aw 作 除数 ,因此 当 |aw | 很 小 时 ,会 损失 精度 ,并 且 
可 能 会 导致 商 太 大 而 使 计算 产生 溢出 。 特 别 当 aw = 0 时 ,运算 就 会 中 断 。 为 了 如 
免 这 种 情形 ,在 每 次 对 角 元 素 归 一 化 之 前 ,必须 增加 一 个 选 主 元 的 过 程 ,将 绝对 值 
较 大 的 元 素 交换 到 主 对 角 线 的 位 置 上 来 。 

2. 主 元 素 消去 法 

在 实际 计算 中 所 需求 解 的 线性 方程 组 往往 不 是 主 对 角 线 占 优 的 ,应 用 高 斯 消 
去 法 直接 求解 常常 会 发 生 au 一 二 0, 使 计算 中 止 ,或 者 |an | 三 1, 使 解 的 精度 降低 ， 
甚至 发 生 错 误 。 如 下 例 ， 


Xl 二 ZX 十 Xs 二 1 (6.1) 
| 十 zz 十 2zs 一 2 (6.2) 
Zi 十 2zz 十 2zs 一 1 (6. 3) 


此 方程 的 系数 矩阵 A 是 非 奇异 的 ,因而 有 唯一 解 z= (1, 一 1,1)"。 然而 在 完 
成 第 一 步 消 元 后 , 则 得 


人 一 1 

zz 十 Za 一 0 

出 现 了 az = 0, 则 高 斯 消去 法 求解 失败 。 如 果 这 时 将 方程 (6. 2) 、(6. 3) 互 换 , 则 正 
好 形成 上 三 角形 方程 组 , 便 可 求解 。 当 然 也 可 将 方程 组 的 2、3 两 列 互 换 得 


下 一 1 
zs 十 zz 一 0 
也 可 应 用 高 斯 消去 法 继续 消 元 ,但 这 时 必须 同时 交换 未 知 量 z: 与 zs 。 
如 果 在 第 上 步 消 元 之 前 ,通过 行 交 换 和 (或 ) 列 交换 将 右 下 子 矩 阵 4 = (ouw) 
(三 1, 2,…, nn) 中 绝对 值 最 大 的 元 素 交 换 在 au 的 位 置 , 则 可 避免 上 述 问题 。 如 


对 上 列 方 程 组 在 进行 第 一 步 消 元 之 前 将 式 (6. 1) 、(6. 3) 两 方程 对 换 , 并 交换 1、2 
两 列 , 则 有 


2zz 十 zi 十 2zs 一 1 (6.4) 
| 十 Zi 十 273 一 2 (6. 5) 
zz 十 Zl 十 zs 一 1 (6.6) 
这 种 通过 行 交 换 和 列 交换 将 右 下 子 和 矩阵 中 绝对 值 最 大 的 元 素 作为 au (k = 1， 
2，…, ?一 1) 的 作法 称 作 选 主 元 素 , 将 选 主 元 素 与 高 斯 消去 法 相 结合 求解 线性 方 


程 组 的 方法 称 为 高 斯 主 元 素 消去 法 ,简称 主 元 素 消去 法 。 选 主 元 素 的 方法 有 列 选 
主 元 和 全 选 主 元 两 种 。 


ey 


列 选 主 元 简称 列 主 元 素 消去 法 ,其 基本 思想 是 在 变换 到 第 上 步 时 ,从 第 4 列 的 
au 以 下 (包括 su ) 的 各 元 素 中 选 出 绝对 值 最 大 者 ,然后 通过 行 交 换 将 它 交换 到 aw 
的 位 置 上 。 这 相当 于 两 个 方程 的 位 置 被 交换 了 ,并 不 影响 求解 结果 。 

但 是 , 列 选 主 元 还 不 能 保证 所 选 的 cs 是 同一 行 中 的 绝对 值 最 大 者 ,因此 ,采用 
列 选 主 元 后 ,虽然 变换 过 程 不 会 中 断 , 但 其 计算 过 程 还 是 不 稳定 的 。 

全 选 主 元 简称 全 主 元 ,其 基本 思想 是 在 变换 到 第 步 时 ,从 右 下 角 (n 一 k 十 1) 
阶 子 阵 中 选取 绝对 值 最 大 者 ,然后 通过 行 交换 与 列 交换 将 它 交换 到 aw 的 位 置 上 。 
全 主 元 过 程 比较 繁复 , 列 主 元 消去 法 相对 而 言 比 较 简单 ,在 实践 中 常常 被 优先 





采用 。 
3. 约 当 (Jordan) 消 去 法 


高 斯 消去 法 自 始 自 终 仅仅 是 对 第 & 行 下 面 的 元 素 进行 消 元 计算 ,而 约 当 消去 
法 还 要 对 第 k 行 上 面 的 元 素 进行 消 元 计算 , 亦 即 约 当 消去 法 是 一 种 无 回 代 过 程 的 
直接 解法 。 它 直接 将 系数 矩阵 变换 成 单位 矩阵 ,而 经 变换 后 的 常数 向 量 即 是 方程 


组 的 解 向 量 。 
消 元 后 计算 的 最 终结 果 为 
1 0] fx] 
1 2 





0 下 


4 矩阵 化 为 单位 矩阵 工 ,而 常数 列 向 量 经 过 ? 次 变化 后 成 为 解 , 即 
X= 6, bY, oe, be )T 


4. 追赶 法 ( 解 三 角 线 性 代数 方程 组 ) 


在 工程 实际 中 ,经 常会 遇 到 形式 为 4X 二 D 的 三 对 角 线 线性 方程 组 ,其 中 系数 


矩阵 A 为 三 对 角 和 矩阵 , 即 


Qn aiz 
Qa 422 dz3 
ld32 da33 a 


Qnr 一 1. -2 


Gal ln-l,n 


ln, nl Ann 


对 于 这 类 方程 组 ,在 用 高 斯 消去 法 时 ,由 于 系数 矩阵 的 大 部 分 元 素 为 0, 只 需 
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要 对 三 对 角 线 上 的 元 素 进行 运算 ,因此 可 以 大 大 减少 计算 工作 量 。 
下 面 是 针对 三 对 角 线 性 代数 方程 组 的 高 斯 消去 法 。 
第 一 步 ,是 归 一 化 与 消去 的 过 程 ,也 称 为 “ 追 ” 的 过 程 。 
这 一 步 的 作用 是 将 主 对 角 线 上 的 元 素 变 为 1, 而 左下 次 对 角 线 上 的 元 素 变 成 
0, 为 了 实现 这 样 的 变换 ,对 于 & 从 1 到 "一 1 作 以 下 两 个 步骤 ， 
(1) 归 一 化 过 程 : 
Qk kt/ amar tti 


di /audi 
(2) 消 元 过 程 ， 


QH 4 一 QH AQ kt TAR+L, 1 


dt — a rd den 
第 二 步 , 是 回 代 过 程 ,也 称 为 “ 赶 ”的 过 程 , 即 


d./am=>xn 


di—arnrinr (k=n—1,.,2,1) 


由 上 所 述 ,这 种 方法 由 于 其 特殊 性 ,也 称 为 “追赶 法 ”。 追 赶 法 本 质 上 是 没 
有 选 主 元 的 高 斯 消去 法 。 如 果 采 用 选 主 元 (不 管 是 列 选 主 元 还 是 全 选 主 元 )， 
则 破坏 了 方程 组 的 三 对 角 人 性质, 也 就 不 能 用 追赶 法 来 求解 了 ,而 只 能 按 一 般 的 
方程 组 来 求解 。 由 于 追赶 法 中 没有 采用 选 主 元 ,因此 ,对 于 一 般 的 三 对 角 线 线 
性 代数 方程 组 来 说 ,追赶 法 的 计算 过 程 是 不 稳定 的 。 但 是 , 当 三 对 角 和 矩阵 满足 
条 件 
|au|> lasl>0 
lail> |aialtlam|>0 G 一 2,3， ,72 一]) 
lam {> lan 
时 ,追赶 法 的 计算 过 程 中 不 会 出 现 中 间 结 果 数 量 级 的 巨大 增长 和 含 人 误差 的 严重 
积累 。 而 在 工程 实际 中 ,许多 三 对 角 线 线性 代数 方程 组 是 满足 上 述 条 件 的 ,因此 ， 
追赶 法 是 有 实用 价值 的 。 
[ 例 6-2] 换 热 式 固定 床 反应 器 的 拟 均 相 二 维 模型 是 抛物 型 偏 微分 方程 组 ， 
求解 该 方程 组 可 获得 温度 及 反应 器 轴 向 和 径 向 的 分 布 。 在 求解 过 程 中 遇 到 如 下 三 
对 角 线 性 方程 组 : 


= 


1.000 一 0.333 Zl 一 0.0296 


0.050 一 1.000 0.150 Zz 一 0.0356 
0.075 一 1.000 0.125 zs| | 一 0.0356 

0.083 一 1.000 0.117 zi| | 一 0.0356 

0.083 一 1.000 0.113||z; 一 0.0356 

0.200 一 1.000j|zj (~—0.0472 


式 中 :X 一 (zl，rz，…，xza) 表示 反应 器 不 同 径 向 位 置 上 反应 物 的 转化 率 。 应 用 
追赶 法 可 解 得 如 下 结果 : X = [0.044 4, 0.044 5, 0.044 5，0. 044 7，0. 045 8， 
0.056 4] ,显然 ,反应 器 中 心 处 的 转化 率 低 于 边缘 处 的 ,这 是 由 于 换 热 式 固定 床 反 
应 器 径 向 温度 分 布 不 均匀 造成 的 。 

5. 矩阵 分 解 求解 

直接 法 求解 线性 方程 组 中 的 一 种 解法 就 是 通过 矩阵 的 三 角 分 解 来 实现 的 。 在 
不 考虑 舍 人 误差 下 ,直接 法 可 以 用 有 限 的 运算 得 到 精确 解 , 因 此 主要 适用 于 求解 中 
小 型 稠密 的 线性 方程 组 。 

(1) 三 角 分 解法 。 三 角 分 解法 是 将 原 n 阶 正规 矩阵 分 解 成 一 个 上 三 角 和 矩 阵 ， 
或 是 上 三 角 矩 阵 和 一 个 下 三 角 抢 阵 的 乘积 ,这 样 的 分 解法 又 称 为 LU 分 解法 。 它 
的 用 途 主要 在 于 简化 一 个 大 矩阵 的 行列 式 值 的 计算 过 程 , 求 逆 矩 阵 以 及 求解 联 立 
方程 组 。 不 过 要 注意 这 种 分 解法 所 得 到 的 上 下 三 角形 矩阵 并 非 唯 一 ,还 可 找到 数 
个 不 同 的 一 对 上 下 三 角形 矩阵 ,此 两 三 角形 和 矩阵 相 乘 也 会 得 到 原 和 矩阵 。 

MATLAB 以 lu 函数 来 执行 lu 分 解法 ,其 语法 为 [L, U] = lu(A)。L 是 下 三 
角 和 矩阵 :lower，U 是 上 三 角 和 矩阵 : Upper。 

方程 组 AX 一 B, 转 化 为 LUX = B, 于 是 X= UT'L-'B。 

(2) QR 分 解法 。QR 分 解法 是 将 矩阵 分 解 成 一 个 正规 正 交 和 矩阵 与 上 三 角 矩 
阵 , 所 以 称 为 QR 分 解法 。Q 为 此 正规 正 交 和 矩阵 。MATLAB 以 qr 函数 来 执行 QR 
分 解法 ,其 语法 为 [Q, R]=qr(A)。Q 是 正 交 和 矩阵,R 是 nx n 的 上 三 角 和 矩阵 。 

方程 组 4X 二 B, 转 化 为 QRX 二 B, 于 是 X= R'Q'B。 


第 三 节 ” 解 线 性 方程 组 的 迭代 法 


对 于 阶 数 不 太 高 的 线性 方程 组 ,用 直接 法 比较 有 效 。 但 对 于 高 阶 方程 组 ,如 果 
其 系数 矩阵 是 无 规律 稀 朴 阵 , 直 接 法 则 需要 占用 较 多 的 存储 空间 ,所 以 人 们 提出 了 
用 迭代 思想 来 求解 线性 方程 组 的 方法 。 
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迭代 法 是 用 某 种 极限 过 程 去 逐步 逼近 线性 方程 组 精确 解 的 方法 。 因 为 它 不 需 
要 存储 系数 矩阵 中 的 零 元 素 ,所 以 所 需 的 存储 空间 较 小 。 其 基本 思想 是 从 一 个 初 
始 向 量 Xe 出 发 ,按照 一 定 的 选 代 格 式 产生 一 个 向 量 序列 {x% } ,使 其 收敛 于 方程 
组 AX = B 的 精确 解 x* 。 

在 讨论 迭代 法 的 过 程 中 要 用 到 向 量 范 数 ,和 矩阵 范 数 等 概念 来 判断 迭代 的 收敛 
性 ,为 此 先 简单 介绍 这 方面 的 知识 。 

1. 向 量 范 数 和 矩阵 范 数 

定义 1 若 对 x, yER", 有 

GD) xl 宇 0, 且 | xl ==0 当 且 仅 当 x = 0; 

(2) lex =| |. 1 xl; 

(3) x+yl < lxl+ lyl, 
则 称 | x || 为 向 量 x 的 范 数 。 

常用 的 向 量 范 数 有 


GD 上 x= 如 1x | (一 范 数 ); 
i=] 
(2) x 有 = ( 驴 如 )(2 一 范 数 ); 
i=] 
(3) | x l= max | x | (无 穷 范 数 ) 。 
将 zXz 矩阵 4 看 作 是 线性 空间 R"x" 中 的 元 素 , 则 完全 可 以 按照 定义 1 的 方 


式 引入 矩阵 的 范 数 。 
和 矩阵 常用 的 范 数 有 : 


GD 14h= ES | ay | ( 列 范 数 ); 
(2) 1 4 外 = Vimwx (ATA) (2 一 范 数 ); 
(8) 14 人 一 Br 如 1 | ( 行 范 数 )。 
[ 例 6-3] 给 定 和 矩阵 








求 141，1412， |41.。 
由 | an | 十 | an | 一 4，] ws | 十 | az | 一 6, 得 14 = 6。 
由 | au | 十 | az | 一 3，| co | 十 | az | 一 7, 得 1141 =7。 
1 | 21_ 『10 ;| 
4L3 4 Lo 20 











全 
A 
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其 特征 值 为 : 4 = 二 15 土 5V5, 上 4 二 V5 十 5V5。 
2. 谱 半 径 
定义 2 设 AER"", 其 特征 值 为 ,32，…, X,, 则 称 


P(A) 一 max | 





为 矩阵 4 的 谱 半径 。 
对 于 4ER"", 则 可 证 明 ,A 的 谱 半径 不 超过 4 的 任何 范 数 , 即 
pe(4)< 1 41 
3. 迭代 法 的 收敛 性 


用 迭代 法 求解 线性 方程 组 AX = B 与 第 五 章 非 线性 方程 求 根 相似 ,对 方程 组 
4X 一 卫 进 行 等 价 变换 ,首先 将 系数 矩阵 4 分 为 


A=N—P 
这 里 要 求 N 非 奇异 ,于 是 方程 可 变换 为 
NX = PX+B 
即 
X=NIPX+N'B— MX+/f 
据 此 ,可 以 构建 迭代 公式 : 
XD = MX 十 
式 中 : M = Ni'P, 了 一 N TB，M 称 为 以 上 迭代 格式 的 迭代 和 矩 阵 。 
任 取 初 始 向 量 X” 一 (zi ，z 刀 ，…，zi0)7 ,代入 和 迭代 式 中 ,经 计算 可 得 到 一 
个 迭代 序列 {X* } ,如 果 它 是 收敛 的 , 即 
limX = XX" 
对 迭代 式 两 边 取 极 限 : 
limX%*? = lim(MX® +/) 
即 X" 二 MX* 十 f,X” 是 方程 4X = B 的 解 。 从 中 可 看 出 , 解 线性 方程 组 的 迭代 
收敛 与 否 完全 取决 于 适 代 矩阵 的 性 质 ,与 迭代 初始 值 的 选取 无 关 。 


可 以 证 明 , 迁 代 格式 X” 一 MX” 十 了 对 任意 的 初始 向 量 导 "都 收敛 的 充分 必 
要 条 件 是 其 迭代 和 矩阵 的 谱 半径 pCMD 一 1。 


== 


一 个 矩阵 的 谱 半 径 需 要 计算 矩阵 的 特征 值 才能 得 到 ,而 这 通常 是 较为 繁琐 的 
工作 ,因此 可 以 通过 计算 矩阵 的 范 数 等 方法 来 简化 判断 收敛 的 工作 。 前 面 已 经 提 
到 过 ,矩阵 4 的 谱 半径 不 会 超过 4 的 任何 范 数 , 对 于 迭代 和 矩阵 M, 也 有 poCM) 一 
1 M1。 因此 ,如 MM 的 范 数 小 于 1, 则 该 迭代 序列 必 收 化。 要 注意 的 是 , 当 M 的 范 
数 大 于 1, 不 能 判断 迭代 序列 发 散 。 

如 果 和 迭代 式 是 收敛 的 ,还 可 以 给 出 近似 解 和 准确 解 之 间 的 误差 估计 。 若 
M1 过 1, 可 证 明 由 迭代 格式 Xe” 二 MX 十 产生 的 向 量 X% 与 方程 的 准确 
解 X” 的 差 值 符合 以 下 关系 式 : 


























lx®—x" | <T lx x 
只 要 M1 不 很 接近 1, 则 可 用 Xew 的 相 邻 两 项 之 差 的 范 数 | Xw 一 X“， | 来 估 
计 ||Xw 一 X” | 的 大 小 
4 简单 先 代 法 
简单 闪 代 法 也 称 雅 可 比 (Jacobi) 选 代 法 。 先 通过 一 个 例子 米 说 明 简单 迁 代 法 
的 基本 思想 。 
[ 例 6-4] 解 方程 组 


上 一 zz 一 2zs 一 7.2 


1 一 刀 十 10xs 一 2zs 一 8.3 (6.7) 
(nxt+5zrs = 4.2 





要 求 准确 到 小 数 点 后 第 5 位 。 
首先 ,分 别 从 方程 组 的 第 一 ,第 二 ,三 个 方程 中 分 离 出 xz!，xs， zs ,从 而 将 方程 
组 (3. 1) 变 为 如 下 等 价 形式 : 
[Zi 一 0. 1zxs 十 0. 2zs 十 0.72 
让 一 0.1zi 十 0.2zs 十 0.83 (6. 8) 
Xs = 0. 2zi 十 0. 2x; 十 0. 84 





然后 任 取 一 组 近似 值 (x 多，z 名 ,xz 铝 ) 代 入 方程 组 (6. 8) 的 右 端 ,从 而 可 以 得 到 
一 组 新 的 近似 值 (xf*?， 2 z+D), 即 


Xt 一 0.1z 多 十 0.2z 多 十 0.72 
ZA 一 0.1zi 十 0.2zg9 十 0.83 (6. 9) 
sh 一 0.2zfo 十 0.2z 十 0. 84 


这 就 表明 ,对 于 上 述 方程 组 (6. 8) ,可 以 从 任意 的 初始 近似 值 (zf? ,zx 多 x" ) 
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出 发 ,利用 和 迭代 格式 (6.9) 进 行 计算 ,从 而 得 到 一 个 近似 解 的 序列 (x9，z 多 ， 


zx), k=0, 1, 2,…。 


在 本 例 中 , 若 取 迭代 初 值 xf? 二 xz? 二 x8 二 


0, 然后 利用 迭代 格式 (3. 3) 进 行 


计算 ,其 计算 结果 见 表 6- 1。 由 表 6- 1 可 以 看 出 ,通过 13 次 的 迭代 ,已 经 满足 了 
预先 规定 的 精度 要 求 , 即 对 于 每 一 个 x;(i = 1, 2, 3) ,前 后 两 次 迁 代 值 之 差 的 绝对 
值 均 小 于 0. 5 X 10。 因 此 , 原 方程 组 (6.7) 的 近似 解 取 为 zi ~ 1. 100 00，za 过 





1. 200 00, zs 六 1. 300 00。 


表 6-1 简单 迭代 法 的 迭代 计算 过 程 

















k 了 他 zx 

0 0 0 0 

1 0.7200 0.8300 0. 840 00 

2 0.971 00 1.07000 1. 150 00 

3 1.057 00 1. 157 10 1.248 20 

4 1.085 35 1. 185 34 1.282 82 

5 1. 095 10 1. 195 10 1. 294 14 

6 1.098 34 1. 198 34 1. 295 04 

1.099 44 1. 199 44 1.299 34 

8 1.099 81 1. 199 81 1.299 78 

9 1.099 94 1. 199 94 1. 299 92 
10 1. 099 98 1. 199 98 1. 299 98 
11 1.099 99 1.19999 1.299 99 
12 1.10000 1. 200 00 1. 300 00 
13 1. 100 00 1. 200 00 1. 300 00 

实际 上 ,该 方程 组 的 准确 解 为 
zi=1.1, Zz = 1.2, T= 1.3 








由 表 6- 1 还 可 以 看 出 , 当 迁 代 次 数 增加 时 ,迭代 得 到 的 近似 值 越 来 越 通 近 方 
程 组 的 准确 解 。 在 这 种 情况 下 , 称 迁 代 格 式 (6. 9) 是 收敛 的 ,其 迁 代 近似 值 序列 
《x 和 多 ,zx 各 ,x 加) 收敛 于 原 方程 组 的 准确 解 。 按 上 述 迭 代 格 式 (6. 9) 求 方程 组 解 的 


方法 称 为 简单 迭代 法 。 


一 般 地 ,对 于 元 线性 代数 方程 组 : 


“05:= 


anzl 十 atzTzz 十 … 十 aiezn 一 名 
azlZl 十 azzZ2z 十 … 十 aznzw = bz (<6. 10) 
QnmZi 十 anzTz 十 … 十 amTu 一 加 
可 以 得 到 简单 迭代 格式 : 
#1 . 
ZH = (di— Dor — Dasrt)/as (i=1,2,.,n,k=0,1,.) 
JI j=+Ht1 
(6.11) 


为 了 便于 收敛 性 分 析 , 将 式 (6. 11) 改 写成 矩阵 形式 。 首 先 其 系数 矩阵 A 可 以 
作 如 下 分 解 : 


Qm | 





式 中 :D 是 对 角 阵 ,L 和 UU 分 别 为 下 、 上 对 角 阵 。 方程 组 (6. 10) 可 改写 为 矩阵 形式 ， 
(D—L—D X=b 
对 于 雅 可 比 迭 代 , 方 程 可 改写 为 
DX 一 (L+U)X+b 
雅 可 比 迭 代 的 矩阵 表达 式 为 
Xe 一 DIE 十 UD)X +D'b 
对 于 雅 可 比 迄 代 法 ,车 其 迭代 和 矩阵 M = D71(L 十 U) 的 范 数 小 于 1, 则 和 迭代 收 
敛 ;或 若 线性 方程 组 的 系数 矩阵 4 满足 下 列 条 件 之 一 , 则 雅 可 比 迭 代 也 收敛 : 


A 


(1) max >) | <1 
i j= zi az | 

(2) max > lal 一 1; 
J 1. i 


人 Tao 


(3) max > | | 一 1。 
i j= jzi [ail 


需要 注意 的 是 ,以 上 只 是 雅 可 比 收敛 的 充分 条 件 而 非 必要 条 件 。 

5. 赛 德尔 迭代 法 

赛 德尔 (Seidel) 和 迭代 法 的 基本 原理 与 简单 迭代 法 相似 ,其 区 别 是 ,在 简单 迭代 
法 中 ,每 次 迭代 时 只 用 到 前 一 次 的 迭代 值 ,而 在 赛 德尔 迭代 法 中 ,每 次 迭代 时 充分 
利用 了 当前 最 新 的 迭代 值 。 

由 Xi 一 (ztb， xz 史 ， Er Zz)T, 计 算 XetD = (zfttD ， gr， 0 AD)T。 
由 于 在 计算 zf > 1) 时 ,已 经 获得 zf ，ztro，…，zg” 的 信息 ,因此 若 能 
在 迭代 过 程 中 及 时 引用 这 些 最 新 信息 , 则 可 能 使 迭代 过 程 加 速 。 

设 方程 组 : 


aiz =6 (=1,2,.,n) 


Fd 


则 赛 德尔 迭代 格式 为 


2 = 6 Haz — Dor) /a 
(i= 1,2, ee k= 0,1, 2, “nn) 
车 以 矩阵 形式 来 表示 ,对 于 赛 德 尔 迭 代 , 方 程 可 改写 为 
(D—DX=UX+b 
赛 德尔 迭代 的 矩阵 形式 : 
XD = (D—D UX®+D—L)'b 
简 记 为 
Xe 二 BXY 十 凡 
式 中 : B, 一 (D 一 L)7'U, f,= (DL)7'。 


下 面 以 [ 例 6- 4 来 比较 简单 迁 代 法 与 赛 德尔 迭代 法 的 收敛 速度 。 
设 方程 组 (6. 7) 已 经 被 分 离 成 式 (6. 8) 的 等 价 形式 , 取 初 值 xf? = 二 xz? 二 zx? 二 
0, 利用 赛 德尔 迭代 格式 
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tb 一 0. 1z 如 十 0.2zg 十 0.72 
z+ 一 0.1zfro 十 0.2x 名 十 0.83 
Le 一 0.2zgtrb 十 0. 2xgo) 十 0. 84 
的 计算 结果 如 表 6 - 2 所 示 。 
表 6-2 赛 德尔 迭代 法 的 迭代 计算 过 程 








人 zh 区 zh 
0 0 0 0 

1 0.7200 0. 902 00 1. 164 40 
2 1.043 08 1. 167 19 1. 282 05 
3 1.093 13 1. 195 72 1. 297 78 
4 1. 099 13 1. 199 47 1. 299 72 
5 1.099 89 1. 199 93 1. 299 96 
6 1.099 99 1. 199 99 1. 300 00 
7 1. 10000 1. 200 00 1. 300 00 
8 1. 100 00 1. 200 00 1. 300 00 











由 表 6- 2 可 以 看 出 ,在 本 例 中 , 赛 德尔 和 迭代 法 要 比 简单 迭代 法 的 收敛 速度 快 。 
但 是 必须 指出 ,这 两 种 迭代 法 的 收敛 范围 并 不 重合 ,只 是 部 分 相交 。 也 就 是 说 ,可 
能 有 简单 迭代 法 收敛 而 赛 德 尔 迭 代 法 发 散 的 情形 发 生 , 赛 德尔 迭代 法 也 并 不 是 总 
比 简单 迭代 法 收敛 快 。 

这 里 还 须 说 明 一 点 ,在 简单 迭代 法 中 ,用 第 次 迭代 值 来 计算 第 k 十 1 次 迭代 
值 ,因此 ,在 迭代 过 程 中 ,必须 用 两 组 存储 单元 分 别 存放 这 两 次 的 迭代 值 。 而 在 赛 
德尔 迭代 法 中 ,只 要 一 组 存储 单元 就 够 了 ,这 也 是 它 的 优点 之 一 。 因 此 , 赛 德 尔 迁 
代 法 一 方面 节省 了 工作 单元 , 另 一 方面 也 使 程序 简单 。 

可 以 证 明 , 若 满足 以 下 任 一 条 件 , 则 赛 德尔 迭代 收敛 。 

(1) 若 线性 方程 组 (6. 10) 的 系数 矩阵 A 严格 对 角 占 优 , 即 


bp lal<larli=1,2,.%,n 


j= 


2 hasl<laslj=1,2,.,n 


(2) 若 线性 方程 组 (6. 10) 的 系数 矩阵 对 称 正 定 。 

6. 松 驰 法 

上 面 介绍 的 两 种 迭代 法 ,在 满足 收敛 条 件 时 ,虽然 迭代 收敛 ,但 没有 解决 收敛 
快慢 的 问题 。 如 果 和 迭代 法 的 收敛 速度 慢 ,将 会 使 计算 的 工作 量 过 大 ,为 此 采用 加 速 
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收敛 的 方法 , 即 本 节 所 介绍 的 松 驰 法 。 
对 于 系数 矩阵 具有 主 对 角 线 优势 的 线性 方程 组 而 言 ,如 采用 赛 德尔 迭代 法 , 则 
首先 由 赛 德尔 选 代 格式 求 得 第 & 十 1 次 迭代 值 ?，'”, 即 


六 1 a 
Tt = (bi Dy avzpty = >)ajz 包 )/as (i=1,2,.,n) 
| j= 


然后 计算 这 个 第 & 十 1 次 迭代 值 与 第 上 次 迭代 值 之 差 , 即 关 ”一刀 ,最 后 ,在 第 
次 迭代 值 的 基础 上 ,直接 加 上 这 个 差 的 一 个 倍数 作为 实际 的 第 十 1 次 的 迭代 值 , 即 


ID = 7 wz 一 zf) 


综合 以 上 过 程 ,可 以 得 到 如 下 的 迭代 格式 : 





加 

TD 一 了 ob Dasryt do — Dasrt)/as (i=1,2,.,n) 
=1 1=i 

为 了 计算 方便 ,将 方程 改写 为 


Ca 十 wo 吕 rorn 一 ai(1 一 w)zfp i+w > air 和 十 ob 
| 7 于 1 
其 矩阵 表达 式 为 
(D 一 oL)Xerb = [(L 一 DoD]Xw 十 ob 

即 

Xe = (Dw D+ UX + D—wL)'b 
式 中 :w 称 为 松弛 因子 。 为 了 保证 迭代 收敛 ,必须 要 求 0 一 w< 反 2。 当 w>>1 时 , 称 为 
超 松 弛 法 ,此 时 加 大 了 Zz/*? 的 比重 。 当 w = 1 时 ,就 是 一 般 的 赛 德尔 迭代 法 。 在 实 
际 应 用 时 ,可 以 根据 系数 矩阵 的 性 质 及 其 反复 计算 的 经 验 来 选 定 合适 的 松弛 因子 


w, 以 加 快 收敛 速度 。 
可 以 证 明 , 若 线性 方程 组 的 系数 矩阵 A 对 称 正定 , 则 当 0 <w < 2 时 , 超 松弛 





迭代 法 收敛 。 
[ 例 6-5] 应 用 赛 德尔 迭代 法 和 松弛 法 迭代 法 求解 下 列 三 对 角 线性 方程 组 : 
—2 1 01fz] [0.5 
1 —2 1 x 一 1.5 
1 一 2 1 | zo 一 1.5 
0 1 一 让 bs 一 0.5 
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在 应 用 差分 法 求解 偏 微分 方程 时 遇 到 的 就 是 此 类 方程 组 ,适宜 于 应 用 松弛 法 
求解 。 若 取 精度 。 二 105, 赛 德尔 迭代 法 需 迭 代 92 次 ,而 松弛 法 (w 一 1. 7) 则 迁 代 
28 次 即 可 收 合 。 可 见 , 只 要 w 选择 得 当 , 松 弛 法 的 迭代 过 程 是 很 快 的 。 


第 四 节 ”应 用 MATLAB 求解 线性 方程 组 


1. 线性 方程 组 的 直接 解法 

关于 线性 方程 组 的 直接 解法 ,本 章 前 面 已 经 有 比较 系统 的 介绍 。 在 MATLAB 
中 ,求解 线性 方程 组 AX 二 d 只 需 用 一 个 命令 X 二 A\d 就 可 以 完成 。 虽 然 表 面 上 只 
是 一 个 简 简单 单 的 符号 ,其 实 它 的 内 部 却 包含 着 许多 的 自 适应 算法 ,如 对 超 定 方程 
采用 最 小 二 乘法 , 解 三 对 角 阵 方程 组 才 用 追赶 法 等 。 

在 有 些 求解 困难 的 情况 下 ,可 先 采用 三 角 分 解 ,再 求解 。 

2. 线性 方程 组 的 迭代 解法 

因 MATLAB 对 矩阵 的 运算 动能 十 分 强大 ,根据 各 和 迭代 方法 的 迭代 格式 的 矩 
阵 表达 式 , 就 可 以 很 容易 地 编写 出 各 自 的 M 文件 。 下 面 以 高 斯 - 赛 德尔 迭代 法 为 
例 。 它 的 MATLAB 的 M 文件 如 下 : 


Seidel. m 
Function s 二 seidel(a,d,x0) (a 为 系数 矩阵 ,d 为 方程 组 AX=d 中 右边 的 矩 
阵 ,x0 为 迭代 初 值 ) 
D=diag(diag(a)); 〈 求 对 角 和 矩阵 ? 
U= 一 triu(a,1) ( 求 严格 上 三 角 和 矩阵 ) 
L 一 一 tril(a, —1); ( 求 严格 下 三 角 甜 阵 ? 
C=inv(D—L); 
B=Cx*xU; 
G=Cx*d; 
s=Bx x0 十 G; 
n=1} 
While norm(s—x0)>=1. 0e 一 5 
x0=s; 
s=Bx x0 十 G; 


n 一 n 十 1; 
end 


[ 例 6-6] 在 MATLAB 中 用 赛 德尔 和 迭代 法 求解 方程 (6. 7) ,误差 控制 在 
10 一 内 。 

首先 输入 赛 德尔 迭代 法 M 文件 ,然后 在 MATLAB 命令 窗口 中 输入 

a 一 [10, 一 1, 一 2; 一 1,10, 一 2; 一 1, 一 1,5]; 

d=[7. 2,8. 3,4. 2] ; 

x0 一 [0,0,0] ; 

seidal(a,d, x0) 


n= 








8 

ans 一 
1. 099999781713155e 十 000 
1. 199999866227841le 十 000 
1. 299999929588199e 十 000 


本 章 学 习 要 点 : 

(1) 掌握 各 种 矩阵 的 计算 .转换 分解。 
(2) 了 解 范 数 和 条 件数 的 计算 。 

(3) 了 解 求解 方程 组 的 矩阵 表示 法 。 
(4) 利用 MATLAB 语句 直接 解 方程 组 。 


第 七 章 ”插值 法 和 数值 微分 


第 一 节 引言 


在 实际 问题 的 计算 中 ,常常 会 遇 到 许多 以 表格 形式 给 定 的 函数 ,如 方 根 表 、 对 
数 表 、 三 角 函 数 表 等 各 种 数学 用 表 、 各 种 生物 数据 表 以 及 实验 室 的 各 种 实验 数据 记 
录 表 等 。 这 些 表格 函数 没有 直接 给 出 未 列 点 处 的 函数 值 。 在 实际 计算 上 常常 需要 
寻找 与 给 定 表格 函数 相 适 应 的 近似 解析 表达 式 ,以 便于 求 定 未 列 点 处 的 函数 值 。 
这 可 通过 构造 与 给 定数 据 相 适应 的 近似 函数 来 解决 ,也 就 是 所 谓 的 插值 问题 。 

为 给 定 表格 函数 构造 相 适 应 的 近似 函数 表达 式 的 可 用 函数 类 型 很 多 ,如 可 用 
代数 多 项 式 , 也 可 用 三 角 多 项 式 或 有 理 函 数 ,甚至 可 用 在 定义 区 间 上 的 任意 光滑 函 
数 或 分 段 光 滑 函数 等 。 由 于 代数 多 项 式 形式 简单 ,计算 方便 , 且 易 于 微分 和 积分 ， 
因此 它 是 最 基本 、 最 常用 的 插值 函数 类 型 。 本 章 仅 介 绍 代数 多 项 式 插值 法 ,简称 代 
数 插值 法 或 多 项 式 插值 法 。 

定义 7-1 设 函 数 y = f(x) 在 [a, 6] 上 连续 , 且 已 知 f(x) 在 zxi(i=0, 1， 
2,…，n) € [a, 5 在 各 点 处 的 y;(i = 0, 1，2, …， n) 值 ( 见 表 7-1), 即 y; 一 
f(xi) 。 如 有 代数 多 项 式 P,(z) 在 zx; 处 满足 : 


P(ri) =y (i=0,1,2,.,n) (7.1) 


则 称 P, (x) 为 函数 y 二 f(z) 的 插值 多 项 式 ,点 x,(i 一 0，1，2，…， n) 为 插值 节 
点 ,[a, 为 插值 区 间 ,y = f(x) 表格 函数 为 被 插值 函数 。 在 代数 多 项 式 中 寻找 
P,(z) 的 方法 称 为 代数 择 值 法 。 式 (7. 1) 称 作 插值 条 件 。 实 质 上 有 
zi) 一 PCzi) 一 0 (i 二 0,1,2,…,n) (各 节点 处 ) 
f(x)—P,(x) = R,(z) ( 非 节点 处 ) 
表 7- 1 插值 表格 函数 








T 











了 加 六 | Bd | | 加 


非 节点 处 的 偏差 R,(z) 与 插值 多 项 式 P,(z) 的 结构 (项 数 ) 有 关 。 代 数 插值 的 
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几何 意义 就 是 通过 给 定 的 n 十 1 个 几何 点 (x,，y;) 
(i 二 0,1,2,…,n) , 作 一 条 nn 次 多 项 式 曲 线 y = 
P,(x) 近似 地 代替 曲线 y 二 f(x), 如 图 7- 1 所 示 。 
由 图 7- 1 可 以 看 出 , y = P,(zx) 是 一 条 围绕 曲 
线 y = f(z) 的 光滑 连续 曲线 。 两 条 曲线 越 接近 , 偏 
差 R,(z) 就 越 小 ,插值 计算 就 越 准确 。 
对 于 给 定 的 表格 函数 y = /(x)， 当 插值 多 项 式 
的 次 数 n 选 定 后 , 则 插值 多 项 式 P,(z) 便 唯一 地 被 确 
定 了 。 因 为 依照 插值 条 件 有 
yi; = P(x7) 三 ao 十 aizi 十 az 好 十 … 十 anz? 
(i=0,1,2,.,n) 


共有 nn 十 1 个 关于 ai(i 二 0, 1, 2,…, n) 的 线性 代数 方程 组 , 解 之 便 可 唯一 地 求 得 
?十 ] 个 系数 ,因此 y = P(x) 是 唯一 的 。 








OO 


图 7-1 代数 插值 的 
几何 意义 





第 二 节 ” 拉 格 朗 日 插值 多 项 式 


拉 格 朗 日 插值 多 项 式 是 一 组 插值 的 基本 公式 , 即 n 次 插值 多 项 式 ,是 代数 插值 
最 基本 而 常用 的 一 类 公式 。 

1. 线性 插值 多 项 式 

线性 插值 多 项 式 也 称 直线 插值 公式 , 即 一 次 插值 公式 : 


y= P(x)=atar (2 


实际 上 就 是 构造 一 个 直线 函数 y = Pi(z) 来 近似 表示 被 插值 函数 y 二 f(x)，, 按照 
插值 条 件 式 (7. 2) ,有 
2 一 已 (ro) 一 ao 十 aizo 
ly 一 PCr) 一 ao 十 atzl 
解 之 得 ae， ai ,从 而 式 (7. 2) 被 确定 。 由 此 可 进一步 证 明 插值 多 项 式 的 唯一 性 。 
但 是 当 n 较 大 时 ,采用 上 述 解 独立 方程 式 求 取 待定 系数 的 方法 很 不 方便 ,通常 
依 插值 条 件 式 (7. 1) ,通过 插值 基 范 数 来 求 定 插值 多 项 式 P, (xz)。 尽 管 求 定 P(x) 
的 方法 不 同 , 表现 形式 也 不 同 ,然而 根据 唯一 性 所 求 得 的 却 是 同一 个 函数 
y=P,(xr)。 
若 将 通过 两 点 (xo. yo) 及 (zi, yi) 的 直线 y = Pi (z) 由 两 点 公式 表示 , 则 有 


二 六 < 





y= Pi(z) = E+ (7.3) 


Xo ! Xo 
. 显然 , 式 (7. 3) 是 唯一 确定 的 , 且 与 式 (7. 2) 等 价 。 可 以 证 明 ， 


ao = (yozl 一 rzo)/Cz 一 z)，ai 三 (一 y)/Cz 一 zo) 














若 令 
Lo(z) = (Z 一 Zi)/(z 一 站 )，LiCzr) 一 (一 zo)VCzl 一 zo) 
显然 ,Lo(z)、L:(z) 都 是 关于 的 线性 函数 , 称 为 线性 插值 的 基 函 数 ,线性 插值 多 
项 式 P, (z) 就 是 这 两 个 线性 插值 基 函 数 的 线性 组 合 。 因 此 ,只 要 知道 基 郴 数 世 (z) 
(i 二 0，1) 的 特征 ,就 可 知道 y = f(x) 的 基本 特征 。 
线性 插值 基 薄 数 在 节点 ze 和 zi 处 的 基本 特征 为 


1 i 
| py de i 
Tr 0 r= 
或 者 
三 未 i ek 
r= 一 | ee 
Ta— 1) 0 i=j 


因此 ,线性 插值 多 项 式 为 


Ek 2: _ = f(z) r= < 
Pi(z) = LT) = I zm = (7. 4) 
直线 插值 多 项 式 主要 用 于 求 取 表 格 中 未 列 点 处 的 表格 函数 值 。 
2. 二 次 插值 多 项 式 2 
二 次 插值 多 项 式 称 抛物 线 插值 公式 , 即 
y= P(x) = oo 十 aiz 十 os 了 2 (7.5) 
这 是 一 个 二 次 三 项 式 , 需 要 3 个 点 (zo， m) 、(Czi, 4)、(zxz，y2) 才 能 唯一 地 被 确 
定 。 实 际 上 就 是 要 通过 离散 函数 y 二 f(z) 在 3 个 节点 zo、n、xz 上 的 函数 值 y 一 
f(zo)、 二 f(z1)、yz 二 f(x), 按照 插值 条 件 式 (7. 1) 构造 一 个 二 次 三 项 式 , 即 y 一 
f(zi) 二 Po(zi) (i 二 1, 2)。 其 几何 意义 就 是 通过 (zo, yx)、(Cz，y)、(Cza 2) 3 个 
几何 点 画 一 条 抛物 线 ,以 此 抛物 线 近似 地 表示 离散 函数 曲线 > = f(z)。 应 用 解析 几 
何 ,不 难 导出 这 条 抛物 线 方程 。 由 于 该 抛物 线 必然 经 过 (zo，yo)、(z1，y1), 于 是， 


y= P:(z) = Pi(z)+a(r— zo)(z— x) 
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为 十 之 加 (rz 一 z) 十 ac(z 一 zo)(z 一 阅 ) 
Xi— Xo 


式 中 :a 为 待定 系数 。 由 于 Ps(z) 还 必须 通过 点 (x,，y,), 因 此 








y= Pr) = yt (rr) +a(rs — zo) (Ts — 1) 








Ti 一 To 
解 之 可 得 
和 二 二 《二 ye ZX2) 
所 以 
y= P(r) 
(rx—X)(r— x2) (Xx—To)(r—x2) (Xx— Xo)(r—x) 








> | 
多 (xzo 一 Zi)(zo — 72) 只 (zl 一 zo)(z 一 z) > (zz 一 Zo)(zz — ZX1) 








2 
yolo Cz) 十 yiLi(Cz) 十 La(z) = > yeLeCz) 
k=0 


式 中 ;二 次 插值 基 沙 数 为 





2 二 
Lz)= I EE (=0,1,2) (7.6) 
j=0 Th— 
J 
其 特征 为 
和 ;一 工 1 i=k 
L(x) = | (CR Eg 
由 1 wa 0 ik ~ , 
+ 
因此 ,二 次 插值 多 项 式 为 
2 开工 一 石 ] [= f(r) r= 
Ps(z) = [ | (k=0,1,2) (7.7) 
2 Sis ssf(x) I 
如 


二 次 插值 多 项 式 也 常用 于 求 取 表 格 中 未 列 点 处 的 表格 函数 值 , 而 且 其 精度 要 
比 线性 插值 多 项 式 高 得 多 。 

3. 拉 格 朗 日 插值 多 项 式 (n 次 插值 多 项 式 ) 

以 下 介绍 n 次 插值 多 项 式 , 即 拉 格 朗 日 插值 多 项 式 的 通 式 。 对 于 一 般 情况 , 需 
7 十 1 个 节点 Zo， Zz ，…， ,构造 一 个 次 插值 多 项 式 , 有 十 1 个 n 次 插值 基 酉 数 : 


y= P,(z) = > yLeCz) (7.8) 
#=0 


.95 


且 次 插值 基 范 数 的 特征 为 





Re 让 全 二 这 
my = Je = (is, k=0, 1,2,.%, n) 

















jE6Th 一 TX 【0 i 关上 

jk 

Tt ( 工 一 zo) (IT— Xe) (IT— XH) "(XT— Xn) 
人 Ts zh 0) ve Cr TT — TH) (Th — Ti) 

和 


(7. 9) 
因此 ,n 次 插值 多 项 式 为 


P,(z) = 站) Ca 
k=0 


a RY 
jk 
(7.10) 


式 (7.8) 或 式 (7. 10) 即 为 拉 格 朗 日 插值 多 项 式 , 它 由 n 十 1 个 n 次 插值 基 函 数 线性 
组 合 而 成 ,由 于 多 项 式 通 过 十 1 个 几何 点 (xo, yo) (1)，*…，(xs， yn), 故 是 
唯一 确定 的 。 

4. 插值 多 项 式 的 余 项 

在 区 间 [a, 6] 上 车 有 n 次 多 项 式 P,(z) 近 似 地 代替 f(x), 即 f(x) ~ P, (x)， 
则 按照 插值 条 件 , 在 节点 zx;(i 二 0, 1, 2,…, n) 上 有 P, (zi) = f(x;), 也 就 是 不 存 
在 偏差 ,但 在 其 他 点 x € [a, 6] 上 ,P(x) 与 f(x) 一 般 并 不 相等 ,在 非 节 点 上 存在 
有 偏差 , 即 R,(z) = f(z) 一 P,(Cz)。R,(Cz) 为 用 P,(x) 近 似 代 替 f(z) 时 的 截断 误 
差 ,为 插值 多 项 式 P,(z) 的 余 项 。 

为 了 求 节点 外 的 其 他 点 处 的 余 项 R,(zx) ,可 作 一 个 辅助 函数 


gD) = GD 一 P,( 一 上 [Gd 一 z) (7. 11) 


显然 , g(0) 在 :一 羡 O 一 0,， 1,，2,，…, m) 处 的 函数 值 为 零 , 即 g(t) 在 插值 区 间 内 有 
?十 1 个 零点 。 
假设 对 于 上 = x (z 尖 羡 ,j 一 0,，1,，…, 7m), 其 函数 值 为 








g(7) = f(z)—P,(z)—k[| (rmz) 
=0 


如 果 选 择 一 个 合适 的 参数 ,使 (0 在 上 一 工 的 函数 值 也 为 零 , 即 








&(z) 一 Cr) 一 PCz) 一 AT[(z 一 六) =0 
j=6 


S06= 


则 对 于 某 个 合适 的 来 说 ,g(t) 有 nn 十 2 个 零点 : t 二 z，Z，…，z，z, 如 果 对 函 
数 g(1) 反 复 应 用 罗 尔 定理 , 则 g' (1) 至少 有 7 十 1 个 零点 ,g (1) 至 少 有 nn 个 零 
点 gorD (0 至 少 有 1 个 零点 。 

设 gr5 (0) 的 一 个 零点 为 司 即 


gu(€) =0, é€€[a,b] 
并 对 函数 g(2) 求 n 十 1 阶 导数 ,由 于 P, (2) 为 n 次 多项式, 因此 其 十 1 阶 导数 为 零 ; 而 


下 Ga 
为 n 十 1 次 的 多 项 式 , 故 "十 1 其 阶 导数 为 (2 十 1)!。 由 此 得 到 
ED (一 or 人 一 上 十 1)1 





显然 有 
gE 一 fH NE 一 上 Ca 十 1)1 一 0 
由 此 解 出 
Ft 
k= CD te [a, 名 


这 就 是 说 , 当 & 为 上 述 值 时 ,上 = 为 g (7) 的 一 个 零点 , 即 


for (6) 加 
g(x) = f(x)—P,(zx) arville zz)=0 








所 以 有 


et 
(Ca 十 
这 就 是 拉 格 朗 日 插值 多 项 式 的 余 项 。 可 用 余 项 公式 估计 插值 计算 误差 。 

[ 例 7-1] 不 同 温度 下 CO; 在 水 中 的 溶解 度 如 表 7 - 2 所 示 , 求 4C 时 CO。 
在 水 中 的 溶解 度 。 





R(x) = f(x)—P,(z) 





首开 人 xz), €€[a,b] (7.12) 
fy 


表 7-2 不 同 温度 下 CO, 在 水 中 的 溶解 度 
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应 用 拉 格 朗 日 插值 公式 ,4C 时 CO; 在 水 中 的 溶解 度 : 
(4 一 1)(4 一 3)(4 一 5) | 0 3213X (4 一 0)(4 一 3)(4 一 5) 








s= 0.3346X 


(0—1)(0—3)0—5) (1—0)01—3)01—5) 

(4 一 0)(4 一 1)(4 一 5) (4 一 0)(4 一 DC4 一 3) 

O297.8 X00 0 1) 35) F217 .4X 0 1a) 
= 0. 287 29 


第 三 节 二 元 插值 


当 实 验 测试 中 含有 两 个 自 变 量 , 如 溶解 度 是 温度 和 压力 的 函数 ,依据 该 实验 测 
试 值 来 推算 非 测试 点 上 的 值 时 , 即 为 二 元 函数 的 插值 问题 。 二 元 插值 的 目的 就 是 
构建 一 个 二 元 函数 = = f(x,y)，, 通过 全 部 已 知 节点 , 即 

zi 让 ) 一 研一 0，1，…，723 了 一 0，1，… 7) 

然后 再 用 = = f(x，y) 计算 在 结 点 M(z，>y) 上 的 值 。 

在 计算 /(MD 时 ,通常 可 以 采取 单 变量 函数 的 插值 方法 ,来 计算 它们 的 函数 
值 , 即 可 先 固定 x, 将 z(x,y) 看 成 是 y 的 函数 ,用 一 元 插值 的 方法 得 到 插值 函数 ， 
简 记 之 为 Pz (zr，y) ,然后 将 函数 P,z(z,，y), 对 工 进行 插值 ,得 到 所 需 的 搬 值 函数 
( 见 图 7- 2)。 


(x 3.3) [6 0] 会 (hs ys) 


人 Go 区 je 人 


先进 行 一 维 插值 求 FLz,， yw) 、F(z，ywrD)、Fz， y+2)， 
再 进行 一 维 插值 求 f(x，y) 
图 7-2 二 元 插值 示意 











人 ro 





(i »-1) 
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第 四 节 ”三 次 样 条 插值 


1. 分 段 插值 法 

在 拉 格 朗 日 插值 中 ,为 了 使 插值 多 项 式 很 好 地 逼近 f(z), 往 往 要 增加 插值 节 
点 ,提高 插值 多 项 式 的 次 数 。 但 是 在 实际 应 用 时 ,过 分 的 提高 插值 多 项 式 的 次 数 会 
带 来 一 些 新 的 问题 。 因 高 阶 导数 使 余 项 不 稳定 ,所 以 ,高 次 插值 多 项 式 ( 如 七 . 八 次 
以 上 ) 很 少 采 用 。 对 高 次 插值 所 存在 的 问题 分 析 如 下 。 

(1) 插值 结 点 的 增多 ( 即 插值 次 数 的 提高 ), 因 然 能 使 插值 多 项 式 P, (z) 在 更 
多 的 地 方 与 (x) 相等 ,但 是 在 两 个 插值 点 之 间 , P,(z) 并 不 一 定 能 很 好 地 逼近 
f(x) ,有 时 差异 很 大 。 下 面 举 例 说 明 。 


， 假 设 给 定 一 个 函数 
Frz) = 1/(1+25z) (~1<r<l) 
现 取 等 距 节点 
Zi =—1+0.2i (i=0,1,.,10) 
来 建立 插值 多 项 式 Pi。(x)。 现 在 用 拉 格 朗 日 插值 多 项 式 Pio(x) 来 计算 x = 
1.0, 一 0.95, 一 0.90, …, 一 0.05, 0 点 处 的 值 ,并 与 用 f(x) = 1/(1 十 25z?) 计 





算 的 结果 进行 比较 。 两 种 方法 的 计算 结果 见 图 7 - 3, 图 中 的 实 线 为 /zx) ,虚线 为 
插值 多 项 式 Po(z)。 由 图 7- 3 可 以 
看 出 ,在 [一 0.2, 0] 范 围 内 , Po(z) 还 
能 较 好 地 逼近 f(z) ,但 在 其 他 各 小 区 
( 即 两 插值 节点 之 间 ) 内 , Pio(zx) 与 
f(x) 的 差异 就 较 大 , 且 越 靠近 端点 其 
允 近 的 效果 就 越 差 。 高 次 插值 所 产生 
的 这 种 现象 称 为 龙 格 现象 。 由 此 可 
知 ,插值 节点 的 加 密 并 不 一 定 能 保证 -10 -08 +06-04-020| 02 04 06_08 107 
两 节点 之 间 揪 值 多 项 式 很 好 地 通 近 ， 
即 高 次 插值 易 引 起 计算 不 稳定 ,及 端 图 7- 3 高 次 插值 的 龙 格 现象 
点 附近 计算 精度 差 。 

(2) 从 计算 过 程 的 舍 人 误差 来 看 ,高 次 插值 中 的 误差 传播 有 时 会 很 严重 。 

综 上 所 述 ,高 次 插值 多 项 式 并 不 实用 ,因为 节点 增加 ,其 插值 精度 未 必 提 高 。 
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那么 如 何 解 决 这 个 矛盾 呢 ? 
方法 之 一 是 采用 分 段 低 次 插值 。 首 先 将 整个 插值 区 间 分 成 各 个 小 区 间 , 然 后 
在 每 一 个 小 区 间 内 用 低 次 插值 。 分 段 低 次 插值 虽然 有 效 地 克服 了 高 次 插值 计算 不 
稳定 及 端点 附近 计算 精度 差 等 缺点 ,但 它 只 能 保证 曲线 的 连续 而 不 能 使 曲线 光滑 ， 
即 在 各 个 小 区 间 的 连接 处 其 导数 不 连续 ,会 引起 失真 。 故 其 主要 用 于 计算 被 插值 
点 上 的 函数 值 ,只 要 节点 选择 适宜 , 便 可 保证 计算 结果 的 精度 。 
方法 之 二 是 采用 分 段 光 滑 插值 。 在 每 两 个 插值 节点 的 小 区 间 内 用 低 次 插值 ， 
但 又 要 保证 在 插值 节点 处 导数 连续 ,也 就 是 在 整个 插值 区 间 内 ,插值 函数 的 曲线 是 
光滑 的 ,这 就 是 样 条 插值 。 
方法 之 三 是 采用 有 理 和 逼近。 一 般 来 说 ,在 插值 节点 相同 的 条 件 下 ,采用 有 理 分 
式 允 近 f(x) 要 比 插值 多 项 式 允 近 的 精度 高 一 些 。 
2. 三 次 样 条 插值 
由 上 述 讨 论 可 知 , 拉 格 朗 日 高 次 插值 多 项 式 可 保证 插值 曲线 光滑 ,但 计算 不 稳 
定 ,而 分 段 低 次 插值 虽然 计算 稳定 ,但 又 不 保证 曲线 光滑 。 在 许多 计算 中 , 既 要 求 
计算 稳定 ,又 要 求 曲 线 光 滑 , 也 就 是 要 求 具 有 连续 的 二 阶 导数 。 应 用 样 条 函数 插值 
可 满足 这 些 要 求 ,因此 , 样 条 函数 插值 得 到 广泛 应 用 。 最 常用 的 是 三 次 样 条 插值 
函数 。 
1) 三 次 样 条 插值 函数 
定义 7-2 对 于 给 定 的 表格 函数 ,已 知 在 La, 5] 上 的 各 点 zi(i=0, 1, 2,…， 
7 处 的 w(i 一 0，1，2，…，7) 值 , 则 要 求 构 造 函 数 S(z) 使 其 满足 : 
(1) SCz) =y (i=0,1,2,.,n); 
(2) 在 [a, b]J 上 ,S(z) 具 有 连续 的 二 阶 导数 , 即 
S(zi—0) = S(z+0) ) 
S'(zi 一 0) 一 S (zi 十 0) pp (i=1,2,.,n—1) 
S“(zi 一 0) = SCzi 十 0) 


(3) 在 子 区 间 [z-i, zi] (i 王 0，1，2，…，, n) 上 ,S;(x) 为 不 高 于 三 次 的 多 项 式 ， 
则 称 SCz) 为 关于 节点 (zi，yY) (i 二 0， 1，2,…, 2) 的 三 次 样 条 插值 函数 ,SCz) 则 
为 分 段 三 次 多 项 式 。 

2) 三 次 样 条 插值 的 边界 条 件 

依据 定义 中 的 第 (3) 条 知 ,S;(z) 在 子 区 间 [z;-1， x;] (i 二 1, 2,…, n) 上 为 不 
高 于 三 次 的 多 项 式 , 于 是 Si(z) = ai 十 br 十 cir? 十 dir3(i 二 1,2,…,n), 共 有 nn 
个 子 区 间 , 每 个 子 区 间 有 一 个 三 次 多 项 式 , 每 个 多 项 式 有 四 个 待定 系数 a;, b;, ci， 
di ,因此 共有 4n 个 待定 系数 。 
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按照 定义 中 的 第 (1) 和 第 (2) 条 ,可 列 出 方程 


S(z) 一 多 (i=0,1,2,., 7n) 

Si(z;—0) = Sinlzi+t+0) (i=1,2,., nC—1) 

S'i(zi—0) = Si(zi+0) (i=1,2,.,n—1) 

S’i(z;—0) = Slzi+t0) (i=1,2,.,n—1) 
共有 方程 数 为 (n 十 1) 十 3(n 一 1) = 4n 一 2 个 。 


显然 要 唯一 地 确定 三 次 样 条 插值 函数 SCz) , 尚 缺 两 个 条 件 。 通 常 由 区 间 [a， 
菇 端点 给 出 这 两 个 条 件 , 称 其 为 边界 条 件 。 
边界 条 件 应 按照 实际 问题 给 出 ,一 般 有 两 类 。 
第 一 边界 条 件 。 给 定 端点 处 的 二 阶 导数 , 即 
S"(z0) = %, S“(z.) 一 次 
在 某 些 计算 中 ,可 近似 地 取 
%= YO 
此 为 自然 样 条 函数 。 
第 二 边界 条 件 。 给 定 端点 处 的 一 阶 导数 , 即 
S'(z0) = yo S'(z)=y, 
3) 以 节点 处 的 二 阶 导 数 表示 的 三 次 样 条 插值 函数 ( 样 条 函数 的 构造 ) 
根据 定义 7- 2, 三 次 样 条 函数 在 插值 节点 处 的 二 阶 导数 存在 ,不 妨 假设 在 各 节 
点 处 的 二 阶 导数 值 为 
Sz) = M, (k=0,1,.,n) 
另 据 定 义 7-2 中 (3) 可 知 ,在 每 一 个 子 区 间 上 ,S(x) 为 一 个 不 超过 三 次 的 多 项 
式 , 因 此 ,在 每 一 个 子 区 间 上 , 其 二 阶 导数 为 线性 函数 ,而 且 S“(z) 也 必然 经 过 点 
[zi， M4-1J 和 [xs，Mi], 则 由 两 点 式 写 出 该 直线 方程 为 








S$"(z) 一 ML 人 — 十 Mt ee 


kT Tk Tl 
一 Me FM, 工 一 2 ， ZE [zy zx] 《7.13)》 
hi he 








式 中 : Ar 二 xi 一 ZT。 如果 对 S”(xz) 积 分 两 次 , 则 得 到 
(xz 一 Z) ， pb me 


一 3 3 
SCz) = Ms Cm +M, (2 起 了 | 


Gh 6het 到 he 








(7.14) 
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式 中 :4 与 6 为 积分 常数 ,它们 可 以 根据 插值 节点 条 件 
S(x01) 一 ye， SCze) 一 了 关 (7. 15) 


来 确定 ,于 是 得 到 





玫 = ye — (Mihi-1/6) i 


b= y: — (Mih?1/6) 
将 式 (7.16) 中 4a 与 b 代 人 表达 式 (7. 14), 则 在 子 区 间 [zx-，， xz] 上 的 表达 式 为 








S(z) = Me i HFM, 开放 十 Do 一 (MLAEV6] 多 一 王 二 


[ys — (Mah? /6)] SF (7.17) 
A 


式 中 :M 与 Mk- 分别 为 子 区 间 [ze-:， 到 的 网 量 遍 站 的 二 了 于 让 位。 由 此 看 出 ， 
只 要 能 确定 各 插值 结 点 处 的 二 阶 导 数值 M, (4 一 0，1，…， nn), 则 各 子 区 间 上 的 三 
次 样 条 插值 函数 SCz) 也 就 确定 了 。 

4) 二 阶 导数 Mk 的 确定 方法 

由 于 SCz) 在 [o, 5] 上 的 一 阶 导 数 是 连续 的 , 即 在 各 节点 的 左右 两 子 区 间 上 的 
S(z) 虽 然 不 同 ,但 在 连接 点 处 的 导数 存在 , 亦 即 S(z) 应 满足 以 下 条 件 : 


S' (rz 一 0) 一 S (zx 十 0) (7. 18) 
为 了 利用 约束 条 件 式 (7. 18) ,必须 先 求 得 SCz)。 由 于 S(z) 在 各 结 点 的 左右 


两 子 区 间 上 的 表达 式 不 同 , 因 此 需要 分 别 考虑 。 
在 子 区 间 [ze-,，ze] 上 ， 


a i a 让 
S'(z) ML (xz —7) 上 RM， CE | /mh /| M Eh 


2hei 2hei he 








(7. 19) 


在 子 区 间 [xe，ztri] 上 ,根据 式 (7. 19) 算 出 S (ze 一 0), 根 据 式 (7.20) 算 出 
S' (rz 十 0), 即 代 人 约束 条 件 式 (7. 18) ,整理 后 得 


ps i i 
Sz) AM xm 一 工 ) 十 Mn EF 十 2 一 站 Me Mi 


2he 四 








(7. 20) 








Sm 一 0) Mh 二 M: = lh 


1 








Mah | yey Ma — My, 
2 6 


hs 


S'(zit+0) 


.02 和 





AMe 十 2M tAMi 一 四 (一 1 一 1) (7.21) 
式 中 : 








he he 
he 十 有" a ec 十 请 
并 且 A 十 Mk = 1。 由 于 有 十 1 个 插值 节点 ,因此 需要 确定 "十 1 个 M。 而 方程 组 
(7.21) 只 有 nn 一 1 个 ,所 以 还 需要 另外 附加 两 条 件 才 能 唯一 地 确定 n 十 1 个 M。 
这 两 个 边界 条 件 可 根据 实际 的 物理 意义 给 出 的 边界 条 件 得 到 。 
问题 1; 利 用 第 一 边界 条 件 Mo 二 y6，M, = y,， 则 确定 的 方程 组 为 


2 1 





di = 6 ) /he 十 hi) 
he he 


(7. 22) 





问题 2: 利 用 第 二 边界 条 件 ,给 定 端点 处 的 一 阶 导数 值 S'(z。) =y%,S'(x,) 一 
ys， 则 得 到 方程 组 : 





2 4 M 1 Fad—pyo 
pm 2 A NM cd 
“ a ; |= : (7.23) 
pr 2 Mr-z||M-: dr 
gee, od lig haa 
式 中 : 

6/N—%_ 
do = 入 人 i yo 


如 此 解 出 Me(& 三 0, 1, 2, …， n), 代入 各 区 间 上 S(z) 的 表达 式 , 即 得 到 三 次 
样 条 插值 函数 。 方 程 组 (7. 22) 和 (7. 23) 的 系数 矩阵 为 三 对 角 矩 阵 , 可 用 追赶 法 求 
解 ,又 因为 系数 矩阵 具有 主 对 角 线 优势 ,因此 数值 计算 是 稳定 的 。 

以 上 所 述 的 样 条 插值 函数 的 构造 方法 ,是 以 节点 处 的 二 阶 导 数值 Mi (k 二 0， 
1，2,…，n) 作为 未 知 数 来 解 ,在 实际 应 用 中 ,也 可 以 以 节点 处 的 一 阶 导 数值 作为 
未 知 数 来 解 ,参照 以 上 做 法 ,自己 可 以 推导 出 SCz) 的 表达 式 。 
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第 五 节 数值 微分 


在 微 积分 中 ,函数 的 导数 是 通过 求 极 限 来 定义 的 。 当 函数 用 表格 给 出 时 就 不 
可 能 用 定义 去 求 它 的 导数 。 生 物 工程 上 有 时 又 需要 求 列表 函数 在 节点 和 非 节 点 处 
的 导数 值 ,这 就 是 数值 微分 所 要 解决 的 问题 。 

1. 用 差 商 近似 微 商 

数值 微分 是 用 离散 方法 近似 地 计算 y 二 f(z) 在 某 点 工 一 4 的 导数 值 。 根 据 导 
数 定义 ,可 以 用 差 商 近 似 微 商 (导数 ), 有 


f(D) 人 (7. 24) 


f (a) 《25} 


ja) 一 Fa 一 名 
h 
式 中 : A(> 0) 为 小 的 增 量 。 式 (7. 24) 和 (7. 25) 分 别称 为 前 差 公 式 和 后 差 公 式 。 如 
果 将 两 式 平均 一 下 ,得 
Ke 十 月 一 Fa 一 站 
f(a) ~ i (7. 26) 

称 为 中 心 差 商 。 

试看 一 下 式 (7. 24) ~ (7.26) 的 几何 意义 。 
在 图 7- 4 中 , f(a) 是 切线 AT 的 斜率 , 而 式 
(7.24)~(7.26) 的 右 端 分 别 是 割 线 AB、AC 和 
BC 的 斜率 ,显然 BC 的 斜率 更 接近 AT 的 斜率 ， 
即 式 (7. 26) 的 精度 更 高 。 将 f(at+h) 和 fa 一 h) 
在 点 a 作 泰 勒 展开 后 代 人 式 (7.24) 一 (7.26) 可 0 an a ath 六 
知 , 式 (7.24) 和 (7.25) 的 误差 为 O(h), 而 式 图 7-4 前 差 , 后 差 和 中 心 
(7. 26) 的 误差 为 OCh?)。 差 商 的 几何 意义 

将 区 间 [a, bjn 等 分 , 步 长 h 二 (5 一 a)/n, 当 函数 y= f(z) 在 分 点 上 用 离散 数 
值 表示 为 (zx,，y) ,函数 在 分 点 的 导数 值 可 以 由 式 (7. 26) 得 到 : 











fr) TH (k=1,2,.,n—1) (7.27) 


但 是 对 于 端点 xo。， zx, ,车 用 式 (7. 24) 和 (7. 25) ,误差 为 OC(h)。 为 了 提高 精度 ,可 以 
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用 二 次 插值 函数 代替 曲线 f(x), 则 


f(z) = 一 (7. 28) 
Cr = 2 一人 二 3 (7. 29) 


式 (7.27) 一 (7. 29) 统 称 为 三 点 公式 ,其 误差 为 O(h?)。 

从 以 上 的 分 析 看 , 步 长 越 小 ,计算 结果 越 精 确 ,但 这 只 是 从 截断 误差 角度 而 
言 的 。 若 从 舍 人 误差 角度 看 ,h 很 小 时 ,ys+1 和 yw-: 很 接近 ,两 者 相 减 会 造成 有 效 数 
字 的 严重 损失 ,因此 不 宜 过 小 。 

2. 利用 三 次 样 条 插值 函数 求 导数 

应 用 三 次 样 条 插值 函数 SCz) 作 为 表格 函数 f(z) 的 近似 表达 式 , 不 但 可 使 函 
数值 非常 接近 ,而 且 可 使 导数 值 也 很 接近 。 因 为 在 一 定 条 件 下 (如 f(x) 具有 连续 
四 阶 导数 ), 当 

h= max he 
趋 近 于 零 时 ,S(x)，S'(x),，S”(z)，S”(z) 分 别 收 僵 于 f(z), (7), f(z)， 
f”(z), 并 且 有 
[flz)—S(r)|= O00), |f (x)—S(r)|= Oh) 
[f°(z)—S"(z)|= Oh), |f”(x)—S"(z)|= Oh) 
因此 ,应 用 三 次 样 条 插值 函数 求 数值 导数 是 可 靠 的 。 如 此 ,不 但 可 求 节点 处 的 导 
数 ,而 且 可 求 非 节点 处 的 导数 。 这 是 工程 计算 中 求 取 数值 导数 的 有 效 方法 。 

对 于 以 节点 处 二 阶 导 数 表 示 的 三 次 样 条 插值 函数 而 言 ,在 k 一 1，2，…，m， 
并 ELzriy zx] 下 可 见 , 一 阶 导数 和 二 阶 导 数 的 计算 式 都 是 由 节点 处 的 二 阶 导数 表 
示 的 。 其 中 ， 





ek CB (i 2 (mC—x) ， 
/DTSDEM me tM + Lye — Mh 1h /6)] he 


[Ly — Mh/0)] 竺 元 2 (7. 30) 
一] 


f(z) oS (r) 
Ms rx) AM, FT) | yy, Me 人 


Zhe “2h el 








(7.31) 
PCr) 一 SCz) = Me 4 +M, <—x) (7. 32) 


1 he 








= 


[ 例 7-2] 某 液体 冷却 时 ,温度 随时 间 的 变化 数据 如 表 7- 3 所 示 。 
表 7- 3 某 液 体 冷却 时 温度 随时 间 的 变化 


= T 


























t/min | 0 1 2 | 3 4 C3 
TC | 92.0 85.3 79.5 | 74.5 70.2 67.0 
PE ee A 
试 分 别 计算 + = 二 1, 2, 3, 4 min 时 及 上 一 0.5, 1.5, 2. 5, 3.5, 4.5min 时 的 冷却 速 


率 ,给 定 两 端点 处 的 一 阶 导 数值 To 二 一 7. 15, Ts 二 一 2. 52。 
根据 题 意 ,前 者 是 计算 节点 处 的 一 阶 导数 ,后 者 则 是 计算 非 节点 处 的 一 阶 导 
数 。 应 用 三 次 样 条 函数 的 式 (7. 31) 计 算 , 其 结果 如 表 7-4 所 示 。 


表 7-4 计算 结果 



































4/min 0 1 2 3 4 5 

dT/dt 715 | e625 | -537 | 46 | 38 | —2.52 
/min 0.5 1.5 2.5 3.5 4.5 

dT/d 一 6.70 | -5.80 | —4.99 | -432 | 一 3.21 





第 六 节 ”应 用 MATLAB 进行 插值 和 微分 计算 


1. 拉 格 朗 日 插值 
MATLAB 中 没有 专门 针对 拉 格 朗 日 插值 的 插值 函数 。 因 此 ,在 MATLAB 上 
使 用 这 类 插值 ,首先 需要 编写 相应 的 M 文件 。 下 面 以 拉 格 朗 日 插值 多 项 式 的 M 
文件 为 例 说 明 , 需 要 进一步 了 解 的 ,请 参阅 有 关 MATLAB 的 书籍 。 
lagr. m 
function s=lagr(x,y, x0) 
nx=length(x); 
m=length(x0); 
for i=1:m 
z= x0(i); 
t=0.08 
for k =1;nx 
u=1.0; 


for j=1 : nx 
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ij 一 一 k 
u 一 Uux (2z 一 X(j))/(x(k) 一 x(j)); 





end 

end 

t 一 t 十 ux y(k); 

end 

s(D=t; 

end 

[ 例 7-3] 龙 格 现象 的 MATLAB 描述 。 在 [一 1, 1] 区 间 内 取 10 个 节点 ,用 
拉 格 朗 日 插值 法 计算 。 

在 MATLAB 命令 窗口 中 输入 

x=[—1: 0.2:1]; 1 


y=1./(1+25 x x.°2); 
x0 一 [一 1: 0.02 : 1]; 


y0=lagr(x,y.x0); 05 

yl=1./(1+25 * x0.°2); 6 

plot(x0,y0, 一 ) 

hold 05T-08-06-0402 0 07 040608 1 
全 图 7- 5 龙 格 现象 的 产生 

得 到 的 图 形 见 图 7- 5。 

2. 分 段 插 值 


对 于 一 维 数据 , MATLAB 提供 interpl 函数 来 进行 数据 插值 。 其 调用 的 格 
式 为 
yi = interpl(x,y,xi, method') 
其 功能 是 返回 插值 向 量 xi 处 的 函数 向 量 yi, 它 根据 向 量 x 与 y 插 值 而 来 。 如 果 
是 一 个 矩阵 , 则 对 y 的 每 一 列 进行 插值 。 如 果 向 量 xi 中 有 元 素 不 在 x 的 范围 内 ， 
则 与 之 相对 的 冰 返 回 为 NaN。 参 数 method 表示 插值 方法 , 它 可 以 取 以 下 值 : 
nearest 最 近 插值 


linear 线性 插值 
spline 三 次 样 条 插值 
cubic 三 次 插值 


method 的 默认 值 为 线性 插值 。 需 要 注意 的 是 ,上 述 的 调用 格式 都 要 求 向 量 x 
为 单调 。 当 x 单调 且 等 间距 时 ,可 以 使 用 快速 插值 法 ,此 时 可 以 选用 方法 “linear”、 
“cubic” 或 “nearest”。 当 x 为 不 等 间距 单调 时 , 可 以 使 用 MATLAB 中 函数 


“07 


interp1 


q 来 快速 插值 。 


对 于 二 维 插值 ,可 以 用 函数 interp2, 其 调用 格式 为 : 


z= interp2(x0,y0,z0,x,y, method') 


x0，y0，, z0 为 插值 结 点 值 ,x,y 为 插值 点 , method 为 插值 方法 ,与 一 维 插值 


相同 。 


[ 例 7-4] 用 线性 分 段 插值 法 计算 [ 例 7- 3] 的 插值 。 


x 一 [一 1:0.2:1]， 
y=1./(1+25* x 2); 
x0 一 [一 1: 0.02: 1]; 
y0=lagr(x,y, x0); 
yl=1./(1+25 x x0. 2); 
y2=interpl (x,y, x0); 








plot(x0,y0, 一 一 ) 

hold 1 he 上 L L L 
plot(x0,yl* 一 9 35008-06-0402 0 07040608 1 
plot(x0,y2, '.") 图 7-6 一 维 线性 插值 求解 龙 格 现象 


结果 如 图 7- 6 所 示 。 
[ 例 7-5] 根据 表 7-5 给 的 数据 ,用 二 维 插值 函数 求 x = 0.3, y 二 0.5 处 


的 值 。 






表 7-5 数 据 








0.2 0.4 





















0.2 7.32 7.08 

0.4 8.08 7.88 7.76 7.76 

0.6 8.92 8.76 8.68 8.76 

0.8 9.84 9.72 | 9. 68 9.84 

1.0 10. 84 10. 76 10.76 11.00 
在 MATLAB 命令 框 里 输入 : 


x0=[0.2:0.2:1.0]; 





0.2:0.2:1.0]; 


z0=17.32 7.08 6.92 6.84 6.84 


8.08 7.88 7.76 7.72 7.76 
8.92 8.76 8.68 8.68 8.76 
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9.84 9.72 9.68 9.72 9.84 
10.84 10.76 10.76 10.84 11.00]; 
z=interp2(x0,y0,z0,0. 3,0. 5) 
可 得 : 
z=8. 4100 
若 用 三 次 样 条 函数 插值 , 即 
z=interp2(x0,y0,z0,0.3,0.5, spline') 
可 得 ， 
z=8. 3900 
3. 三 次 样 条 插值 
MATLAB 提供 的 三 次 样 条 插值 泣 数 有 spline 与 interpl 两 个 ,其 中 interp1l 前 
面 已 经 有 过 介绍 ,spline 函数 的 调用 格式 如 下 : 
y0 = spline(x,y, x0) 
利用 三 次 样 条 插值 法 寻找 在 插值 点 x0 处 的 插值 函数 y0, 插 值 消 数 根据 输入 
参数 x 和 y 的 关系 得 来 。 
[ 例 7-6] 湖水 中 磷 和 毛 的 浓度 之 间 有 一 定 的 关系 , 表 7 -6 是 一 组 不 同 湖 
水 中 的 测量 值 。 


表 7-6 湖水 中 磷 和 气 浓 度 的 测量 值 


湖泊 | 磷 浓 度 /(mg/m ) | 氢 浓 度 /(mg/m?) | 湖泊 | 磷 浓 度 /(mg/m?) | 握 浓 度 /(mg/m’) 





1 4.5 0.8 5 19.5 4.4 
2 5.5 1.2 6 21.0 5.5 
3 8.0 2.0 7 39.0 11.0 
4 17.5 3.8 





求 当 磷 的 浓度 为 15 mg/m’ 时 , 氯 的 浓度 为 多 少 。 
在 MATLAB 命令 窗口 中 输入 : 
x 一 [4. 5,5. 5,8.0,17. 5,19. 5,21.0,39.5]; 
y=[0. 8,1.2,2.0,3.8,4.4,5.5,11.0]; 
spline(x,y,15) 
即 可 得 到 : 
ans 一 
3. 3727 
[ 例 7-7] 在 MATLAB 中 求解 [ 例 7-1]。 


-109- 


先 在 MATLAB 命令 窗口 中 输入 
format long e 
x=[0 1 3 5]; 
y=[0. 3346 0. 3213 0. 2978 0. 2774]; 
xl 一 4; 
然后 用 各 种 插值 方法 计算 
lagr(x,y,x1) 
ans 一 
2. 872900000000001e - 001 
spline(x,y,x1) 
ans 一 
2. 872900000000000e- 001 
interpl (x,y, x1) 
ans 一 
2. 876000000000000e - 001 
从 上 面 的 结果 可 以 进一步 说 明 ,分 段 线性 插值 的 精度 不 如 其 他 插值 方法 。 
4. 数值 微分 
MATLAB 中 提供 了 一 个 非常 粗略 计算 微分 的 函数 diff, 它 可 以 来 计算 数组 间 
元 素 的 差分 。 函 数 的 调用 格式 如 下 : 
diff(x) ,对 于 向 量 x, 返 回 的 结果 是 [x(2) 一 x(1)，x(3) 一 x(2)，…，x(Cn) 一 
x(n 一 1)]。 
因此 ,对 于 给 定 的 数组 [x, yj], 可 以 用 diff(y). /diff(x) 数 组 的 除法 来 求 导 , 当 
然 也 可 以 根据 前 面 介绍 的 三 点 公式 编写 M 文件 来 求 导 。 
另外 ,MATLAB 工具 箱 里 有 一 个 样 条 工具 箱 ,根据 样 条 工具 箱 提 供 的 函数 ， 
我 们 可 以 很 容易 地 构造 样 条 函数 以 及 对 样 条 函数 进行 各 种 操作 。 下 面 以 例 7- 2 
为 例 简要 介绍 该 工具 箱 中 某 些 函数 的 用 法 , 需 进 一 步 了 解 其 用 法 的 请 参阅 相关 
书籍 。 
样 条 工具 箱 中 的 csape 函数 可 以 构造 各 种 边界 条 件 下 的 三 次 插值 样 条 函数 。 
其 调用 格式 为 





pp = csape(x,y, conds',valconds) 


式 中 :(x，y) 为 插值 点 的 序列 ,pp 为 指定 条 件 下 以 (x,y) 为 插值 点 所 返回 的 pp 形 
式 的 三 次 样 条 函数 。conds 为 边界 条 件 , 可 为 下 列 字符 串 或 字符 串 的 第 一 个 字母 : 
' complete', ' not-a-knot', ' periodic', ' second',' variational'。 它 们 的 含义 如 下 : 
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complete 一 一 给 定 端点 的 斜率 ,斜率 大 小 在 valconds 参数 中 给 出 ; 
not-a-knot 一 一 两 个 端点 存在 三 阶 连 续 导数 ; 
periodic 一 一 给 定 周 期 特性 ; 

second 一 一 给 定 端点 的 二 阶 导 数 , 大 小 在 valconds 参数 中 给 出 ; 
variational 一 一 给 定 端点 的 二 阶 导数 , 且 大 小 均 为 零 。 

ppval 函数 可 以 计算 在 节点 处 x 样 条 函数 pp 的 值 ,调用 格式 为 
ppval(pp, x) 

对 样 条 函数 求 导 可 以 用 函数 fnder 来 完成 。 其 调用 格式 为 
fprime 一 fnder(pp,dorder) 

函数 返回 样 条 函数 pp 的 第 dorder 阶 微分 ,dorder 的 确 省 值 为 1。 
显示 样 条 函数 pp 的 格式 是 

disp(pp. coefs) 

[ 例 7-8] 计算 获得 [ 例 7- 6] 的 氯 浓度 与 磷 浓 度 之 间 的 关联 表达 式 。 
x=[4.5,5.5,8.0,17.5,19.5,21.0,39.5]; 

y=[0. 8,1.2,2.0,3.8,4.4,5.5,11.0]; 

pp=csape(x,y); 

disp(pp. coefs) 


运行 结果 为 

0. 0008 一 0.0268 0. 4261 0. 8000 
0. 0011 一 0.0246 0. 3747 1. 2000 
0. 0008 一 0.0165 0. 2721 2. 0000 
0. 0263 0. 0069 0. 1810 3. 8000 
一 0.0169 0. 1648 0. 5243 4. 4000 
一 0. 0066 0. 0886 0. 9043 5. 5000 


上 面 得 到 的 COEFS 含义 是 在 xi 到 x(i 十 1) 区 间 上 的 多 项 式 系数 ( 共 6 个 区 
间 ) , 按 次 方 降序 排列 。 

例如 COEFS 数组 第 一 行 是 指 在 x=4. 5 到 x=5. 5 的 区 间 上 表达 式 是 ， 

y=0,0008 x (x—4.5)-3—0. 0268 * (x—4.5)°2 二 0. 4261 x (x 一 4. 5)-1 十 
0. 8000 

由 此 获得 各 个 区 间 的 三 次 样 条 函数 ,以 此 为 基础 ,可 分 别 求 取 其 一 阶 导 数 和 二 
阶 导 数 的 表达 式 。 

[ 例 7- 2] 中 给 出 了 端点 的 一 阶 导数 ,因此 可 以 编写 如 下 的 weifen. m 文件 来 构 
造 样 条 函数 ,对 样 条 函数 求 导 并 输出 节点 处 和 非 节点 处 的 导数 值 。 


weifen. m 








a ch 


x=[0 12345]; 

y=[92 85. 3 79. 5 74. 5 70. 2 67]; 

pp 一 csape(x,y, complete',[—7. 15, 一 2. 52]); 

df 一 fnder(pp); 

dfl=ppval(df, x) 

df2=ppval(df,[0. 5,1.5,2.5,3.5,4.5]) 

运行 结果 如 下 : 

dfl 7.1500 6. 2451 5. 3697 4. 6761 3. 8260 2. 5200 
df2 一 一 6.7012 ”一 5.7963 一 4.9886 一 4.3245 一 3. 2135 








本 章 学 习 要 点 : 

(1) 了 解 拉 格 朗 日 插值 的 计算 和 编程 计算 。 

(2) 了 解 余 项 的 估计 。 

(3) 了 解 样 条 函数 的 表示 。 

(4) 了 解 三 点 求 导 公式 。 

(5) 运用 MATLAB 插值 语句 interp，spline 计算 和 求 导 。 


he 


第 八 章 数值 积分 


第 一 节 引言 


在 实际 工程 问题 中 ,通常 不 但 要 求 出 某 些 函数 在 给 定点 的 函数 值 ,而 且 需 要 求 
出 这 些 函数 的 积分 值 。 在 这 类 积分 中 ,被 积 函 数 往往 比较 复杂 , 找 原 函数 比较 困 
难 ,甚至 以 离散 形式 给 定 ,不 能 用 求 原 函数 的 方法 来 解决 。 但 这 些 问题 都 可 以 用 数 
值 积分 的 方法 来 解决 。 

[ 例 8-1] 某 一 发 酵 反 应 器 的 模型 为 


式 中 :V 为 反应 器 体积 ,msa;r 表示 反应 速度 ,kmol/(m?。h); nm 为 反应 物料 中 关 
键 组 分 A 的 初始 摩尔 数 ;zr 和 za 分 别 为 初 、 终 转化 率 ; 为 反应 时 间 ,h。 当 反应 
中 投料 体积 不 发 生变 化 时 , 则 

t= Cw)” dza/r 
式 中 ; Cm 二 nw/V，kmol/mi，, 称 作 组 分 A 的 初始 摩尔 浓度 ;反应 速度 x 是 转化 率 
的 函数 ,这 种 函数 关系 可 通过 动力 学 实验 来 求 得 。 当 ~(zA) 关 系 复杂 时 ,上 式 即 需 


日 数值 积分 或 图 解法 求解 。 
实际 上 ,在 相当 多 的 工程 问题 计算 中 所 过 到 的 定 积分 

















Prowar= Fn| (8.1) 
常常 找 不 到 原 函 数 F(x) ,因此 无 法 解析 积分 ,而 只 能 用 数值 积分 的 方法 求解 。 
在 积分 问题 式 (8. 1) 中 ,f(z) 称 为 被 积 函数 ,La, 5] 称 为 积分 区 间 , F(x) 为 原 
函数 ,积分 值 为 FCz)| 。 
数值 积分 就 是 利用 被 积 函 数 f(x) 在 给 定 节点 zi (二 0, 1，2, 7z) 的 函数 值 
f(x) 的 某 种 线性 组 合 来 近似 求 取 式 (8. 1) 的 积分 值 , 即 
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[pvr orf) taf + thf en) = Df mn) C8.2) 
a ko 


|repaz= Df rd) +RLA] (8. 3) 
本 二 一 0 


式 (8.2)、(8. 3) 称 作 数 值 求 积 公 式 ,hx 为 求 积 系数 ,R,[ 了 /为 求 积 公 式 的 余 项 。 
常用 的 数值 积分 方法 是 以 插值 多 项 式 为 基础 的 ,有 


f(x) = P,(zx) + R(x) 
式 中 : 


P,(z) = > fx) I [zr— x) /Cz —z)] 
k=0 j=0 


jk 


若 令 


Auk(z) = 了 [(z—z)/(z — 2z)] 


6 
Fe 
则 有 P,(z) 二 AsCz)fCz), 因此 
k=0 
b 时 b oy 
Ppscwar = Df) apdz= Df ln) 
a k=0 帮 k=0 
求 积 公式 为 
b b b 
Predar | P,Czydz 十 | Rdr = DMF) HR (8.4) 
: 5 名 
比较 式 (8. 3) 与 (8. 4) ,可 知 求 积 系 数 为 
n= /ADdr (k=0,1,2., 7 (8.5) 
求 积 公式 的 余 项 : 
pb 
R.CP = | Rndz 


显然 ,只 要 确定 了 节点 数 n 及 节点 值 zk 二 0,，1, 2, nn), 便 可 求 出 ,并 由 被 
积 函 数 求 出 f(z) ,从 而 可 求 出 近似 积分 值 , 便 可 估计 误差 。 式 (8.4) 称 为 插值 型 
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由 式 (8. 5) 可 知 , 求 积 系数 与 被 积 函 数 无 关 , 而 只 与 节点 zx 的 函数 值 F(ze) 有 
关 , 因 而 数值 积分 结果 与 节点 zx(& 一 0, 1, 2, n) 的 数目 及 其 分 布 密切 相关 ,节点 数 
目 及 节点 分 布 不 同 ,数值 积分 的 精度 便 不 同 。 常 用 的 插值 型 求 积 公式 有 两 类 :第 一 
类 是 节点 zx 在 积分 区 间 [a, 5j 上 等 距 分 布 , 即 有 二 x 一 ze 一 const, 称 作 牛 顿 - 柯 
特 斯 求 积 公式 ;第 二 类 是 节点 zs 在 积分 区 间 [a, 6] 内 按照 菜 种 格式 非 等 距 分 布 , 即 
hh 二 zh 一 Zt 天 const, 称 作 高 斯 型 求 积 公式 。 可 以 证 明 , 这 两 类 求 积 公 式 因 节点 
的 选择 方法 不 同 ,具有 不 同 的 误差 和 代数 精度 。 


第 二 节 ”牛顿 - 柯 特 斯 公式 


牛顿 - 柯 特 斯 求 积 公式 是 一 类 等 距 节 点 分 布 的 插值 型 求 积 公式 ,简称 牛顿 - 柯 
特 斯 公式 。 下 面 考虑 等 距 节点 的 几 个 简单 情形 。 | 

1. 基本 公式 

1) 梯形 公式 

设 a, 6b 为 插值 节点 , n 二 1, 作 线 性 插值 


Pi(z) = Eb (0) 十 270) 


a—b 





则 


6 0 一 a 
[cwar ~ [peodz= 扎 “ro +Fo] (8.6) 





其 余 项 为 
[rcwar— [Pitz)dr =— FO -a), ee [a, b] 


式 (8. 6) 为 梯形 公式 ,其 几何 意义 是 由 梯形 面积 近似 地 代替 曲线 下 的 面积 [ 见 
图 8-1(a)]。 

2) 三 点 公式 (辛普森 公式 ) 

设 插值 节点 为 a, 5, c, 其 中 c= 二 (a 十 5)/2, n 一 2。 作 二 次 插值 


[Sm AF ad.) (zr—a)(zr—b) (Cra) Ce—=6) 
(a VT ae Vt oa ee 








P,2(z) 
则 
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LE3) TD) 
2 
0 a 5 OO a (atby2 $b 这 





(a) (b) 
图 8- 1 牛顿 - 柯 特 斯 公式 的 几何 意义 


a+b 
2 





Prewar~f Pindz = +4/( 


3 )+f | (8.7) 


其 余 项 为 


f° (0—a)s 


hb b 
[rerar—f P(r)dr =— 和 CB te [a, 


式 (8.7) 即 为 辛普森 (Simpson) 公 式 , 其 几何 意义 是 由 抛物 线 下 面积 近似 代替 
曲线 下 的 面积 见 [图 8 - 1(b)]。 类 似 地 可 取 二 3, h 二 (5 一 a)/3, 作 三 次 插值 : 


[fz,) +3fC71) +3f (zs) + f(zs)] 





re 人 Piepdz 一 





3hs 由 
R,(f) | red [psnar fC) 6E [a, 名 








同样 ,n == 4, h = (6 一 a)/4。 
b 





[fewar | Pir)dr = 37 fm) +32f6n) +12f(7) +32f(7) +7f(z4)] 


8 





Br eo, 
RD = fwd -Pndr od, ee [ae 名 








如 此 可 求 得 一 系列 的 积分 近似 值 。 一 般 说 来 , 随 着 ”的 增加 ,近似 积分 的 精度 提 
高 ,但 当 n 宇 8 后 ,采用 


ou Paar 
时 计算 不 稳定 ,近似 积分 的 精度 受到 限制 ,因此 在 实际 计算 中 ,并 不 采用 n 较 大 的 
求 积 公 式 。 
[ 例 8-2] 试用 梯形 公式 和 辛普森 公式 分 别 计算 


= 


的 近似 值 。 
由 梯形 公式 ,可 得 


1=| ~ (+I) 0875 


由 辛普森 公式 ,可 得 











I | I 人 ~ 1# (74 t 4xTTUR | I) 0.783 

而 其 真 值 为 x/4, 约 为 0.785 398。 

2. 复 化 公式 

在 上 述 基本 公式 中 ,由 于 插值 区 间 较 大 , 且 插 值 节点 较 少 ,因而 误差 较 大 。 为 
了 解决 这 个 问题 ,可 以 将 插值 区 间 分 小 ,对 于 每 一 个 小 区 间 用 上 述 基 本 公式 ,由 此 
得 到 的 积分 公式 称 为 复 化 公式 。 

1) 复 化 梯形 公式 

将 插值 区 间 n 等 分 , 步 长 h = 二 (5 一 a)/n, 节点 坐标 为 


Zh 二 a 十 欣 (k= 二 0, 1，2，…， 7 
然后 在 每 一 小 区 间 内 用 梯形 公式 , 即 











ml py ol 
frowar= Df /dD SELF) + fz)] 
i keO™ Th k=0 
rl 
= [fa) 十 (CO)] 十 六 > fz) = T, (8.8) 
k=1 


式 (8. 8) 即 为 复 化 梯形 公式 ,其 几何 意义 是 利用 n 条 直线 所 构成 的 折线 代替 曲线 
3 三 (x) 来 求 积分 ,其 余 项 为 


[rwar—T, = te [a, 





2) 复 化 辛普森 公式 
按照 同样 的 方法 ,在 上 述 小 区 间 内 用 辛普森 公式 ,可 以 得 到 








el el 
roduz= [ro FFCB) 1+ 22 fn + 4 光 /(a+ 和 名 )] S, (8.9) 
这 就 是 复 化 辛普森 公式 ,其 余 项 为 


人 





[wr— s, —— 4 (和 ) op， ee [ae 器 


上 面 讨论 了 两 种 特殊 而 简单 的 插值 求 积 公 式 及 其 相应 的 复 化 公式 。 在 捅 值 求 
积 公式 中 ,用 不 同 次 数 的 插值 多 项 式 就 可 以 得 到 不 同 阶 数 的 插值 求 积 公式 。 一 般 
来 说 ,用 nn 次 插值 多 项 式 P,(z) 得 到 的 求 积 公式 称 为 n 阶 牛 顿 - 柯 特 斯 公式 ,梯形 
公式 与 辛普森 公式 就 是 一 阶 与 二 阶 牛顿 - 柯 特 斯 公式 。 

仍 以 [ 例 8 - 1] 为 例 计 算 : 如 取 n 二 4, 则 有 h = 0. 25, 由 复 化 梯形 公式 可 得 








1 
,Te 

0.25/_1 i 1 1 1 

~ (THE +i)+t0.25X (Troa5 +1ITOF +1To75) 

一 0.78279 

由 复 化 辛普森 公式 计算 可 得 





3 
本 1 1 1 
22 fm) 2(TFo 25 + TFos + 1675) 


十 








3 
hh 1 ff 1 
Df (mt3)= (TF + TF + TFB + THe7787:) 


k=0 
saz ~ 训 [fO TAD +2D fm + (nt 言 ) ]~ 0.785 398 





| 于 l+z’ 


最 后 要 指出 ,有 了 牛顿 - 柯 特 斯 公式 并 不 说 明 积分 问题 已 经 解决 ,在 实际 计算 
中 ,通常 要 根据 问题 的 性 质 与 要 求 而 采用 不 同 的 求 积 方法 ,牛顿 - 柯 特 斯 公式 只 是 
一 个 基础 。 


第 三 节 ” 变 步 长 梯形 求 积 法 


在 数值 积分 中 ,精度 是 一 个 很 重要 的 问题 ,如 果 误 差 太 大 ,就 没有 实际 意义 。 
前 面 所 述 的 复 化 求 积 公式 , 若 步 长 h 取得 太 大 , 则 精度 难以 保证 ; 若 步 长 h 取得 太 
小 , 则 计算 工作 量 会 增加 ,并 且 积累 误差 也 会 增 大 。 因 此 ,重要 的 问题 是 合理 地 选 
择 步 长 ,使 得 既 满 足 精度 ,又 不 至 于 引起 过 多 的 积累 误差 与 过 大 的 计算 工作 量 。 在 
实际 计算 时 ,往往 采用 变 步 长 的 求 积 法 。 下 面 以 梯形 公式 为 例 来 说 明 这 种 方法 。 
第 一 步 :利用 梯形 公式 计算 积分 , 即 取 
=1,h=b—a 
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则 有 


T,= 乞 品 [rezo) + f(r)] 














第 二 步 : 将 求 积 区 间 再 二 等 分 一 次 ( 即 由 原来 的 n 等 分 , 变 为 2n 等 分 ) ,利用 复 
化 梯形 公式 ,有 
T, S 3 Ef) + Ls) + fm ] 
kh ST + fren)]1 和 fens) = 二 了 ,十 h S$ fxm0s) 
4 名 2 2 名 


式 中 :.F(Czeros ) 为 再 二 等 分 一 次 后 所 新 增加 的 节点 函数 值 。 由 此 可 以 看 出 ,为 了 计 
算 二 等 分 后 的 积分 值 , 只 要 计算 新 增加 的 分 点 值 F(zttas) 就 可 以 了 ,而 原来 节点 的 
函数 值 不 必 重 新 计算 ,因为 它 已 包含 在 第 一 项 中 。 

第 三 步 :判断 二 等 分 前 后 二 次 的 积分 值 之 差 的 绝对 值 是 否 小 于 所 规定 的 误差 ， 
若 条 件 

|T» —T,|<e 
成 立 , 则 二 等 分 后 的 积分 值 T2, 即 为 结果 ;否则 作 如 下 处 理 : 
h/2>h, 2n=>n, T=T, 


然后 重复 第 二 步 。 
上 述 方法 即 为 变 步 长 梯形 求 积 法 。 它 是 以 梯形 公式 为 基础 ,逐步 改变 步 长 以 
达到 所 要 求 的 精度 ,此 方法 的 递 推 公式 为 


1 
Te = 二 并 十 全 2 (zuas) 
=0 


式 中 :T, 为 二 等 分 前 的 积分 值 。 右 端的 第 二 项 只 涉及 二 等 分 时 新 增加 的 分 点 值 
zttos), 这 就 避免 了 老 节点 上 函数 值 的 重复 计算 。 


仍 以 [ 例 8 - 1] 为 例 ,说 明 变 步 长 梯形 求 积 法 的 计算 过 程 : 
当 n= 二 1 时 ， 
T+ 0.75 


= (rt 41)= 


当 n 二 2 时 ， 


二 人 9 一 


一 0.782 79 





i ( 1 1 ) 
2 4 1+(1/4) 1 十 (3/4) 


第 四 节 ” 龙 贝 格 求 积 法 


在 复 化 梯形 公式 中 ,将 区 间 [a, 5jn 等 分 ,h = (5 一 a)/n, 则 


pe 
T= > PCz)dz 
k=0™ 区 


其 余 项 为 
| reoaz- T, =- "(8) (8. 10) 
再 利用 变 步 长 梯形 法 则 ,就 得 到 
一 1 
各 3T, + 多 2 f(zwes) 
式 中 :Tz 的 余 项 为 





fn-T, = ($s) Fe) (8.11) 


因 区 间 足 够 小 ,了 (&) 守 了 六 (6&2)。 
由 式 (8. 10) 和 (8. 11) ,可 以 得 到 二 等 分 前 后 的 两 个 积分 值 T, 和 T,, 的 余 项 之 
比 为 


六 ea- 
(8.12) 
| roadr- 区 
从 式 (8.12) 可 以 解 出 
[War $T, T= (8.13) 


容易 验证 , 式 (8. 13) 即 为 复 化 辛普森 公式 , 即 


4Tz 一 人 工 


S, = rl 
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可 以 看 出 ,在 变 长 梯形 法 则 中 , Tz 和 T, 的 误差 限 没有 本 质 上 的 差别 ,和 皆 为 
Oh?)。 只 不 过 Tz 的 截断 误差 为 OCh?)/4,T, 的 截断 误差 为 OLh?), 两 者 只 相差 一 
个 倍数 ,但 是 , Tz, 与 T, 经 过 线性 组 合 后 , 变 成 了 辛普森 公式 ,其 误差 限 变 为 O(h*)， 
精度 显然 提高 了 。 

同 理 , 由 于 复 化 辛普森 公式 的 余 项 为 





[war—s, = 有 (全 /8) 


利用 变 步 长 辛普森 法 则 ,由 S, 算得 Sz,, 则 Sz 的 余 项 为 


fds = 和 (全 全 


由 此 得 到 二 等 分 前 后 两 个 积分 值 S, 和 Sx 的 余 项 之 比 为 
| ro 5, 
是 一 忆 16 
[fewar—s,, 

从 上 式 可 解 出 


Sm —S, 


| War ss, — 吉 S, = 4 字 = 





(8.14) 


同样 ,可 以 验证 式 (8. 14) 实 际 上 是 四 阶 柯 特 斯 公式 , 即 





其 误差 限 为 OCh*)。 按 照 上 面 的 叙述 ,同样 可 得 到 六 阶 的 龙 贝 格 公式 , 即 


Go—G 


| 


其 误差 限 为 OCh*)。 

由 以 上 分 析 可 以 看 出 ,在 变 步 长 法 则 中 ,虽然 二 等 分 后 的 误差 要 比 二 等 分 前 的 
误差 小 一 些 ,但 从 本 质 上 讲 ,其 精度 没有 差别 ,误差 限 只 相差 一 个 倍数 。 但 是 ,二 等 
分 前 后 的 两 个 积分 值 经 线性 组 合 后 ,其 精度 明显 提高 ,相当 于 比 它 高 两 阶 的 牛顿 - 
柯 特 斯 公式 的 精度 。 

一 般 来 说 ,2m 阶 柯 特 斯 公式 为 


4" Tn (h/2) — T, (h) 


Tn (h) = 3 


二 下 


其 误差 限 为 OC(h”™*?)。 
上 述 数值 积分 的 方法 称 为 龙 贝 格 求 积 法 ,其 计算 序列 见 表 8-1。 


表 8-1 龙 贝 格 序列 计算 过 程 
































k {Ta*} {S2*} {Ca} {Rs*} 
0 | on 5s @C 0R, 
1 OT ©s OC @R 
2 @T, ®s, BC. 

3 OT 四 3 

4 DT 





下 面 以 [ 例 8 - 1] 为 例 ,说 明 用 龙 贝 格 求 积 法 的 计算 过 程 。 
(Df(0) =1,f0) = 0.5; T= 去 [fC0) +f(1)] = 0.75 


1 二 
(2) /(#)=0.8 
去 二 工 rf( 工 一 
五 一 瑟 亿 十 去/ 去 )= 0.775 
Si 一 4 一 Th 一 0.783 33 


(3) /( 寺 )= 0.941 18; f(3)= 0.64 


T= 二 T+ i[/(# )+f(3 )]=078279 


4T, 一 二 = 0.785 39 





S:= 


C= Ss,— 埋 s, 一 0. 785 53 
nA Dr 








5S, =$T:— 3T 一 0.785 40 


16s,- 工 s, = 
C = 8S — 155: 一 0.785 39 


=j22= 


64 
R= 63C:— 直 c = = 0.785 39 


一 般 Ri 已 有 很 高 的 精度 ,如 需 更 高 精度 ,可 比较 两 次 尺 值 ,满足 精度 要 求 。 

[ 例 8-3] 某 气相 二 聚 反 应 2A = S 在 等 温 管 式 反应 器 内 进行 ,反应 条 件 为 
二 638'C ,反应 器 内 径 d 二 10 cm, 进 气 速率 Fe 为 10 kmol/h。 根 据 等 温 管 式 反应 
器 模型 ,可 得 反应 器 管 长 


一 4Va/(xa) = -FoCu] dr/ 一 m) 


式 中 :反应 速率 由 下 式 给 出 : 





a 
(Ss 91.4[ S08 13. 16xa 十 5. %] 


(3— IA)’ 


试 计算 转化 率 za 为 0.1, 0.2, 0.3, 0.4, 0.5 时 所 需 的 反应 器 管 长 。 
应 用 龙 贝 格 求 积 法 可 得 表 8 - 2 所 示 的 结果 。 


表 8-2 反应 器 管 长 











第 五 节 高 斯 求 积 法 


1. 代数 精度 的 概念 

一 般 而 言 ,数值 求 积 法 是 近似 的 方法 。 在 实际 应 用 中 ,为 了 提高 数值 求 积 公式 
的 精度 ,要 求 某 个 数值 求 积 公式 对 于 尽 可 能 多 的 函数 能 够 准确 成 立 ,特别 地 ,要 求 
一 个 数值 求 积 公式 对 于 次 数 尽 可 能 高 的 多 项 式 积分 能 准确 成 立 , 这 就 是 数值 求 积 
公式 的 代数 精度 的 概念 。 

如 果 一 个 数值 求 积 公式 对 于 被 积 函数 为 次 数 不 超 过 m 的 所 有 多 项 式 都 能 准 
确 成 立 ,而 对 于 m 十 1 次 多 项 式 就 不 一 定 准确 , 则 称 该 数值 求 积 公 式 的 代数 精度 为 
m, 或 称 该 数值 求 积 公 式 具有 m 次 代数 精度 。 

前 面 讨论 的 插值 求 积 公式 ,是 以 等 距 节点 的 拉 格 朗 日 插值 多 项 式 为 基础 的 ,由 
于 nn 次 多 项 式 的 n 次 拉 格 朗 日 插值 多 项 式 就 是 该 多 项 式 本 身 ,因此 ,n 阶 牛 顿 - 柯 特 
斯 公式 至 少 具有 n 次 代数 精度 。 从 前 面 误差 分 析 可 知 ,梯形 公式 具有 一 次 代数 精 
度 ,辛普森 公式 具有 三 次 代数 精度 。 一 般 当 n 为 奇数 时 ,至 少 具有 次 代数 精度 ; 


> 12 


当 n 为 偶数 时 ,至 少 具有 n 十 1 次 代数 精度 。 
设 数 值 求 积 公 式 为 


| reoar= Df Cr) (8. 15) 
党 i=0 


一 般 来 说 ,为 了 要 使 求 积 公式 (8. 15) 具 有 m 次 代数 精度 , 则 要 求 当 被 积 函 数 f(x) 
为 1，z, 三 ，…， zx” 时 ,该 求 积 公式 准确 成 立 ( 即 误差 为 0), 则 式 (8. 15) 中 的 各 求 
积 节点 zx; 与 求 积 系数 4; (i 一 0，1，2，…， n) 满足 如 下 条 件 : 


2 一 5 一 4 
Paz = 1 —a’) 
A 2 (8. 16) 


S eps | 1 _ jmtl 
2 元 下 IC wr 


式 (8. 16) 是 关于 zx 与 4; (i 二 0, 1, …, n) 的 非 线 性 方程 组 。 如 果 事 先 选 定 各 
求 积 节点 zx; (i = 0, 1,，…，,n)，, 并 取 m 二 n, 则 式 (8. 16) 是 一 个 线性 方程 组 ,从 中 
可 解 出 各 求 积 系数 A; (i 二 0, 1,，…, n)。 如 以 求 积 区 间 [a, 6b] 的 各 等 分 点 (n 等 分 ， 
得 n 十 1 个 等 距 节 点 ) 为 求 积 节点 ,就 得 到 n 阶 牛 顿 - 柯 特 斯 公式 ,至 少 具有 nn 次 代 
数 精度 。 

2， 高 斯 求 积 公式 

在 数值 求 积 公式 (8. 4) 中 ,如 果 适 当选 择 各 求 积 节点 zx; 及 求 积 系数 1,(i 一 0， 
1,，…，,n), 使 之 具有 2n 十 1( 即 mm 二 2n 十 1) 次 代数 精度 , 则 该 求 积 公式 称 为 高 斯 求 
积 公式 。 高 斯 求 积 公式 中 的 各 求 积 节点 称 为 高 斯 点 。 

作为 一 个 特例 ,下 面 考虑 在 区 间 [ 一 1，1] 上 x 十 1 个 点 的 高 斯 求 积 公 式 , 即 


1 
| ,f(z)dr = Df zi) (8.17) 
3 i=0 


在 方程 组 (8. 17) 中 , 令 a = 一 1,0 一 1, 六 一 22 十 1, 就 可 以 得 到 各 高 斯 点 zi 与 
求 积 系数 4; (i 二 0，1,，…， n) 应 满足 的 条 件 为 
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加 十 十 ha 十 "十 hs 二 2 
Mozo 十 Mizl 十 hzzz 十 … 十 Mnzs 一 0 


如 十 入 召 十 4 吾 十 … 十 Xnz? 一 也 


加 冯 十 Ni 友 十 ja 六 十 …… 十 ari 一 HE" —(— Dm] 














hoz8 十 xP 十 Azx9 十 十 AnT2 一 0 
当 n 一 0 时 ,方程 组 简化 为 
Mo 一 2 To 一 
. 出 1 
be =0 角 ho 一 2 
十 一 2 号 全 
Mozo 十 Nizl 一 0 
一 1 时 ， 和 
当 n 时 ,方程 组 为 i = 和 解 出 4 
N=1 
NT 和 Zi =0 
A 
No 十 和 1 十 A2 二 2 
Moxzo 十 Mizl 十 hzzz 一 0 
ho78 十 zf 十 hzz2 一 和 
当 n 一 2 时 ,方程 组 为 解 出 
四 加 了 3 十 Nizi 十 ia 好 一 0 1 
一 二 
5 
0 


Mo 十 Ntzi 十 Mzz 


hozi 十 Nizt 十 haz 一 





(8. 18) 
V3 
3 
xo =— V15/5 
ZI 二 
Zz = V15/5 
ho = 5/9 
A1 = 8/9 
ha = 5/9 


以 此 类 推 , 可 得 到 n= 二 0, 1, 2, 3, 4 时 ,高 斯 求 积 公式 (8. 18) 中 各 高 斯 点 及 求 


积 系数 ,如 表 8- 3 所 示 。 
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表 8-3 高 斯 求 积 公式 的 高 斯 点 及 求 积 系数 





一 一 一 
n i C9 
0 0.0 2.0 
i 一 0. 577 350 27 1.0 
0. 577 350 27 1.0 
2 一 0.774 596 67 0. 555 555 56 
0.0 0. 888 888 89 
0.774 596 67 0. 555 555 56 
3 一 0. 861 136 31 0. 347 854 85 
一 0.339 981 04 0. 652 145 15 
0. 339 981 04 0. 652 145 15 
0. 861 136 31 0.347 854 85 
4 一 0.906 179 85 0. 236 926 89 
一 0. 538 469 31 0. 478 628 67 
0.0 0.56888889 .| 
0. 538 469 31 0.478 628 67 
0. 906 179 85 0. 236 926 89 








对 于 任意 的 求 积 区 间 [a, 缮 ,可 以 通过 变换 
工 一 专 [a 十 b 十 (6 一 a)4] 
化 为 区 间 [ 一 1, 1], 即 


六 edz= 邱 扩 7( 娃 2+)d= 刀 | FOOd 














= Dafz) (8. 19) 
气 
式 中 ， 

盖 结 2+ 疆 48， 一 0 1 2， ,由 (8.20) 


由 于 》 与 jzi) 无 关 ,只 与 = 有关 ,因此 上 述 的 各 A; 在 [a, b]J 上 不 变 。 只 要 由 
式 (8. 20) 求 得 高 斯 点 所 对 应 的 x;, 则 可 求 得 函数 值 f(x;) ,从 而 可 由 式 (8. 19) 求 
与 牛顿 - 柯 特 斯 公式 相 比 ,高 斯 求 积 公式 不 仅 具 有 高 的 代数 精度 ,而 且 数 值 计 
算是 稳定 的 。 利 用 高 斯 求 积 公式 可 以 有 效 地 计算 区 间 端 点 为 奇异 的 广义 积分 。 
[ 例 8-4] 应 用 n= 二 4 的 高 斯 求 积 公式 计算 积分 
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之 值 。 
由 式 (8. 19) 知 ， 


ll 8.5+3.5 (i=0,1,2,3,4) 


由 表 8 - 3 查 得 求 积 系数 4、 高 斯 点 上 ,并 计算 x; 和 f(x;) ,其 结果 列 于 表 8- 4。 
表 8-4 高 斯 求 积 公式 求 积 过 程 


i 0 1 | 2 3 | 4 
















0. 236 926 89 
一 0. 906 179 85 
5.328 370 4 
0. 187 674 6 





0. 478 628 67 
一 0.538 469 31 
6.615 357 5 
0.151 163 4 


0. 568 888 89 
0 
8.5 
0.117 647 1 


0.478 628 67 
0. 538 469 31 
10. 384 642 6 

0.096 296 1 


0. 236 926 89 
0. 906 179 85 
11.671 6297 
0.085 6778 
























由 式 (8. 19) 可 得 


| 

5 工 4 

而 其 解析 解 为 民 坚 = nz 一 0.8754687373。 
可 见 ,高 斯 求 积 公式 的 精度 是 相当 高 的 。 


4 
> hr(r) = 0.875 468 6 
名 


第 六 节 ”应 用 MATLAB 计算 积分 


MATLAB 自身 提供 一 些 常用 的 积分 函数 ,利用 这 些 函 数 可 以 很 方便 地 进行 
积分 计算 。 


1. 变 步 长 辛普森 法 
MATLAB 中 的 quad 函数 采用 变 步 长 辛普森 法 来 计算 


TI= | /fdr 
的 近似 值 。 可 自动 选择 积分 步 长 使 其 相 邻 两 次 值 的 绝对 或 相对 误差 小 于 预先 给 定 
的 允许 误差 限 。 调 用 的 函数 格式 为 : 


q 一 quad( fun',a,b, tol, trace) 


a 


fun 包含 函数 名 的 字符 串 


a 函数 的 积分 下 限 

b 函数 f 的 积分 上 限 

tol 积分 精度 

trace 如 果 trace 不 为 零 , 则 做 出 积分 函数 f' 的 积分 图 。 否 则 不 做 图 。 
q 函数 的 积分 值 

2.quadl 函数 


MATLAB 中 的 quadl 函数 采用 的 是 自 适 应 递 推 步 长 符合 Lobatto 算法 ,其 使 
方法 .要求 .输入 参数 和 quadl 函数 相同 。 
3. 二 重 积分 dblquad 函数 和 三 重 积分 triplequad 函数 
dblquad 函数 时 在 矩形 区 域内 求 二 重 积分 的 函数 ,其 调用 格式 为 
q 一 dblquad(fun，a,b,c,d,tol) 
式 中 :fun 是 二 元 被 积 函数 ,a, b 是 变量 + 的 上 下 限 ,c, d 是 变量 > 的 上 下 限 ,tol 为 
积分 的 精度 要 求 。 
triplequad 函数 用 于 积分 限 都 为 常数 的 三 重 积 分 。 其 调用 格式 为 
q=triplequad(fun, a,b,c,d,e,f, tol) 
式 中 :fun 是 三 元 被 积 函数 ,a，b 是 变量 zx 的 上 下 限 ,c, d 是 变量 y 的 上 下 限 ,e， 
f 是 变量 = 的 上 下 限 ,tol 为 积分 的 精度 要 求 。 
4. 高 斯 法 和 龙 贝 格 法 求 积 
MATLAB 中 没有 专门 的 程序 ,需要 自行 编制 M 文件 。 例 如 根据 表 8 - 3 编写 
nn 二 3 (4 节点) 的 高 斯 求 积 公式 的 M 函数 . 


Guass3. m 

















function s 一 guass3(a,b) 
x 一 [0. 86113631, 一 0. 86113631,0. 33998104 ,一 0. 33998104]; 
u 一 [0. 34785485,0. 34785485 ,0. 65214515 ,0. 65214515]; 
t=0. 0; 
for i 一 1:4 
y=x(i) * (b—a) * 0. 5 十 (a 十 b) * 0. 5; 
t 一 t 十 u(i) x jifen(y); 
end 
s 一 tx (b 一 a) * 0. 5; 
其 中 需要 事先 编写 被 积 函数 的 M 文件 jifen. m 
[ 例 8-5] 用 MATLAB 求 解 [ 例 8- 3]。 





~ 


首先 编写 jifen 文件 。 
jifen. m 
function y=jifen(x) 
y=1./x 
用 变 步 长 辛普森 法 求解 : 
>>quad( jifen',5,12,1e- 6) 
ans 一 

8. 754687554733633e- 001 
用 高 斯 法 (n 一 3) 求 解 : 
>>guass3(5,12) 
ans 一 

8. 754628285403491e - 001 
用 牛顿 - 科 特 斯 法 求解 
>>quad8(@ijifen,5,12) 
ans 一 

8. 754687373578546e- 001 
quadl(@ijifen,5,12) 
ans 一 


8.754688114348608e- 001 


本 章 学 习 要 点 : 

(1) 了 解 牛顿 - 柯 特 斯 公式 。 

(2) 了 解 梯形 公式 、 辛 普 森 公式 及 其 计算 。 
(3) 了 解 牛顿 - 柯 特 斯 公式 的 代数 精度 。 
(4) 了 解 龙 贝 格 法 求 积 。 

(5) 利用 MATLAB 求解 数值 积分 。 


= 


第 九 章 ，” 常 微分 方程 初 值 问题 的 数值 解法 


第 一 节 引 言 


在 实际 计算 中 经 常会 遇 到 求解 常 微分 方程 或 方程 组 的 问题 。 在 生命 科学 中 经 
常 碰 到 的 问题 是 对 过 程 的 动态 分 析 , 即 研究 过 程 参量 随时 间 的 变化 规律 。 如 人 口 
的 增长 与 年 龄 结构 的 变化 .生物 的 增长 以 及 种 群 的 繁衍 与 死亡 等 。 

[ 例 9-1] 设 一 生态 系统 中 有 甲乙 两 个 群体 ,种 群 甲 靠 丰 富 的 自然 资源 生 
长 ,而 种 群 乙 靠 捕食 甲 为 生 。 两 者 共处 组 成 食 饵 -捕食 者 系统 。 设 zi (2 ，zz (t) 分 
别 为 食 饵 甲 和 捕食 者 乙 在 时 刻 t 时 的 数量 , 当 甲 独 立 生 存 时 它 的 相对 增长 率 为 ~， 
捕食 者 离开 食 饵 后 无 法 生存 , 设 乙 独立 生存 时 死亡 率 为 5, 它们 之 间 的 关系 可 以 用 
Lotka-Volterra 方程 来 描述 : 

dz 
dt 


一 一 bz 十 crizz 


式 中 :比例 系数 a 和 * 分 别 反映 了 捕食 者 掠 取 食 饵 的 能 力 和 食 饵 对 捕食 者 的 供养 能 力 。 
显然 这 是 一 个 常 微分 方程 的 问题 。 

由 于 微分 方程 组 与 高 阶 微分 方程 都 可 以 化 为 一 阶 微分 方程 来 求解 ,因此 ,本 章 
主要 以 一 阶 微分 方程 为 基础 来 讨论 数值 解法 的 基本 方法 。 


=rr1—arizs 


二 节 ”数值 解法 的 基本 思想 


对 于 常 微分 方程 的 初 值 问 题 一 般 可 表示 为 


(a<t<h) (9.1) 


=130= 


一 般 要 在 区 间 [a, 6] 上 的 若干 离散 点 4 二 4 二 4 二 … 过 二 5 处 计算 求解 函数 y 
(4) 的 近似 值 。 

由 此 可 以 看 出 , 常 微分 方程 数值 解法 的 基本 出 发 点 就 是 离散 化 ,即将 求解 区 间 
[a, 如 分 成 各 离散 点 ,然后 直接 求 出 各 离散 点 上 的 解 函 数 y(z) 的 近似 值 , 而 不 必 求 
出 解 函 数 y(t) 的 解析 表达 式 。 

在 实际 计算 中 ,通常 取 求 解 区 间 [a, 65] 的 等 分 点 作为 离散 点 , 即 


右 一 4 十 页 (i 二 0, 1, ,nn) 
式 中 :hh = 二 (6 一 a)/n 为 步 长 。 
求 常 微分 方程 数值 解 的 方法 有 很 多 ,最 常用 的 是 化 导数 为 差 商 。 
在 微分 方程 的 初 值 问 题 式 (9. 1) 中 ,如 果 在 点 处 的 导数 用 差 商 来 近似 代 
替 , 即 





YD) (9.2) 


则 微分 方程 的 初 值 问题 式 (9. 1) 化 为 


2 一 水 = 一 9 i 一 本 py 一 
| 站 Gy) (i=0,1 m1 人 
3?o 一 了 7 
由 式 (9. 3) 可 以 得 到 微分 方程 (9. 1) 的 数值 解 序列 {y } 的 如 下 关系 : 
他 一， (9.4) 
Yn 一 上 十 hf y) (i=0,1,.,n—1) 


这 是 一 个 递 推 关系 ,只 要 知道 了 初 yo ,就 可 以 根据 这 个 递 推 公式 依次 求 得 y， 
Y2s "Yno 


第 三 节 欧 拉 方 法 


哆 拉 方 法 体现 了 初 值 问 题 数 值 解法 的 基本 思想 ,其 基本 思路 是 应 用 均 差 代替 
导数 ,使 微分 方程 离散 化 。 采 用 不 同类 型 的 均 差 ,可 构成 不 同类 型 的 差分 方程 ,从 
而 求 得 的 近似 解 也 有 所 不 同 。 

1. 欧 拉 公 式 

在 点 4 处 化 导数 为 差 商 , 则 


并 


全 二 也 (9.5) 
ym 一 站 十 AFGG y) (i=0,1,.,n—1) 
这 是 一 个 显 式 公式 ,根据 前 一 个 点 上 的 函数 值 y; 可 以 直接 算出 后 一 个 点 上 的 函数 
值 y+1。 因 此 只 要 初 值 已 知 , 则 由 公式 可 以 递 推 确定 微分 方程 的 数值 解 序列 {y;}。 
欧 拉 公式 的 几何 意义 在 于 用 连续 折线 方程 
yn = yhflti, yi) (i=0,1,.,n) 


近似 地 表示 曲线 方程 y 二 y(z)。 两 个 方程 的 起 始点 均 为 (to，yo), 当 n>oo, h->0 
时 ,曲线 与 折线 重合 ,因此 欧 拉 公 式 可 收敛 于 初 值 。 

以 下 分 析 欧 拉 公 式 的 计算 误差 。 若 设 第 i 步 及 其 以 前 步 的 计算 无 误差 , 即 
i 二 y(t;), 则 第 i 十 1 步 的 误差 作 局 部 截断 误差 。 为 此 ,将 函数 y(2) 在 ti; 处 作 泰勒 
展开 : 








yb) = y+ en 少 旦 ,+ bm 和 ， 
一 多 十 MG yD) 二 让 Cy 二 (9.6) 
比较 式 (9. 6) 与 (9. 7), 有 
yy =— 直 fC 0) 十 … 一 DG) C9.7) 


可 见 , 欧 拉 公 式 的 局 部 截断 误差 为 O(h?), 即 步 长 h 的 二 阶 无 穷 小 量 。 实 际 上 , 除 
y% 三 y(to) 之 外 ,从 yt 开始 便 有 误差 ,而 且 这 些 误差 在 以 后 的 各 步 计 算 中 均 会 累 
积 。 可 以 证 明 , 欧 拉 公 式 的 总 误差 为 O(h), 即 与 步 长 h 为 同 阶 无 穷 小 量 。 欧 拉 公 
式 也 称 一 阶 法 。 

2. 后 退 欧 拉 公式 

若 应 用 一 阶 向 后 均 差 近似 代替 任意 点 i+ 处 的 导数 , 则 有 

人 = | (9.8) 
ym = +hf Gms yn) C=0,1, wa 一 1 


该 式 为 一 后 退 公 式 , 由 式 (9. 8) ,根据 前 一 个 点 上 的 函数 值 y; 还 不 能 直接 算出 后 一 
个 点 上 的 函数 值 y;+, ,因为 右 端 第 二 项 包含 有 未 知 函数 值 w+:。 但 式 (9. 8) 实 际 上 
为 一 非 线性 方程 ,用 解 非 线性 方程 的 方法 可 解 出 y;+1 。 

后 退 欧 拉 公 式 的 几何 意义 是 应 用 另 一 条 折线 


rt = yithfltns yn) (i=0,1,.,n—1) 


= 12 


近似 表示 曲线 方程 y 一 y(z) ,如 图 9-1 所 示 。 


欧 拉 公 式 一 一 






后 退 欧 拉 公 式 








2 为 Xl . 


图 9-1 欧 拉 公 式 .后 退 欧 拉 公式 ,梯形 公式 的 几何 意义 
经 分 析 , 后 退 欧 拉 公 式 的 局 部 截断 误差 也 为 OC 如 ), 即 


yi yn) = fs 十 一 OO (9.9) 


可 以 证 明 其 总 误差 为 OCh) ,与 欧 拉 公 式 一 样 同 称 为 一 阶 法 。 

3. 改进 的 欧 拉 公 式 

根据 欧 拉 公式 和 后 退 欧 拉 公 式 的 误差 分 析 , 由 式 (9.7) 和 (9.9) 可 知 两 者 的 局 
部 截断 误差 均 为 O(h?), 且 主 部 相同 ,而 符号 相反 。 因 此 , 式 (9.5) 和 (9. 8) 相 加 有 


2 一 也 
(9. 10) 
yn 一世 十 全 [Fe yD + fm yn)] C=0,1, ,nD) 


这 便 是 梯形 公式 。 显 然 , 其 局 部 截断 误差 应 为 OCh3) ,总 误差 为 OCh?) ,改进 的 欧 拉 
公式 称 为 二 阶 法 。 

实际 上 梯形 公式 也 为 隐 式 公式 ,必须 用 迁 代 法 求解 。 但 用 迁 代 法 求解 ,其 计算 
工作 量 很 大 (因为 每 计算 一 点 都 得 用 迭代 法 )。 所 以 在 实际 应 用 中 ,计算 每 一 点 的 
2 值 只 和 迭代 一 次 ,通常 称 之 为 预报 与 校正 的 方法 。 

首先 ,用 欧 拉 公式 算出 初步 的 近似 值 y;+ , 称 之 为 预报 值 ,然后 用 预报 值 w+ 
替代 梯形 公式 右 端的 y;+! 进 行 计算 ,得 到 校正 值 y:;;。 这 个 过 程 可 用 下 面 的 两 个 
公式 来 概括 。 

预报 公式 : 


<3= 


Tri = yi thf ls, yi) 
校正 公式 
yin 一 + 名 [fa yD) + fltn, Fn)] 
也 可 以 改写 成 如 下 形式 : 
yi 一 攻 十 去 ( 生 二 如 ) 
hi = hf ri, yi) (9.11) 
kz = hf (xith, y;t+ ki) 


由 于 预报 -校正 公式 (9. 11) 是 由 欧 拉 公 式 预 报 , 然 后 再 用 梯形 公式 来 校正 ,因此 , 通 
常 也 称 为 改进 的 欧 拉 公式 。 
[ 例 9-2] 分 别 应 用 欧 拉 公式 和 改进 的 欧 拉 公 式 求解 下 列 初 值 问题 : 


gy_ ,一 天 
人 中， xe [0,1 


y(0)=1 
该 方程 的 精确 解 为 
y(z) = VI 十 2 
欧 拉 公 式 的 具体 形式 为 
yi 一 +h(» 一 此 ) (i=0,1,.,n) 
改进 的 欧 拉 公式 的 具体 形式 为 
Yin 一 和 十 去 (本 十 知 ) 


车 取 步 长 h 二 0.1, 计算 结果 见 表 9- 1。 


二 一 


表 9-1 计算 结果 























六 
欧 拉 法 改进 的 欧 拉 法 准确 解 
0 0 1 1 1 
1 全 六 1.1 1.095 909 1.095 445 
2 0.2 1.191 818 1.184097 1.183216 
3 0.3 1.277 438 1.266 201 1.264 911 
4 0.4 1.358 213 1.343 360 1. 341 641 
5 0 1.435 133 | 1.416 402 1.414 214 
6 0.6 1. 508 966 1.485 956 1.483 240 
党 0.7 1. 580 338 1.552 514 1.549 193 
8 0.8 1. 649 783 1.616 475 1.612 452 
9 0.9 1.717779 1.678 166 1.673 320 
10 1.0 1.784 771 1.737 867 1.732 051 
从 表 9- 1 中 可 看 出 ,改进 的 欧 拉 法 的 精度 要 明显 高 于 欧 拉 公式 。 
第 四 节 ” 龙 格 - 库 塔 法 
1. 问题 的 提出 
对 于 微分 方程 初 值 问 题 
y = fy) 
y(to) 一 了 
如 果 已 知 y(t;) = y;, 需求 y;+1, 则 由 微分 中 值 定理 : 
人 =y(+0) (0 一 9 二 月 
可 以 得 到 
Yt) = yt) + hy (t+ 0h) 
即 
yi = y+ hf [t+ Oh, yt;+0h)] (9. 12) 


式 中 :f(t 十 9h，y(ti 十 级 )) 为 区 间 [ii， ti,1] 上 的 平均 斜率 。 


= 


由 公式 (9. 12) 可 以 看 到 ,只 要 对 区 间 [t;, t+1] 上 的 平均 斜率 提供 一 个 算法 ,就 
可 以 得 到 相应 的 计算 公式 。 
在 欧 拉 公 式 中 ,用 点 (4;， y;) 处 的 斜率 y 二 f(z,，y) 来 近似 代替 [ti, try] 上 的 
平均 斜率 , 即 
yt yi hf (ti, yi) 


在 改进 的 欧 拉 公 式 中 ,用 点 (z,，y;) 处 的 斜率 和 点 (6+1，7i+1) 处 的 斜率 的 算术 平均 
值 来 近似 代 蔡 区 间 [ti，, tit1] 上 的 平均 斜率 ,其 中 点 (ii， i+1) 处 的 斜率 是 通过 点 
(4，yi) 处 的 信息 来 预报 的 , 即 


Ki = f(;, y) 
Ks = f(tn, yit+hK) (9. 13) 


ym 一 六 十 名 (Ki 十 Ks) 


前 已 知道 , 欧 拉 公式 每 一 步 的 截断 误差 为 OCh?) ,而 改进 的 欧 拉 公式 每 一 步 的 截断 
误差 为 OL)。 可 以 设想 ,如 果 在 区 间 [ti, ti+1] 上 多 预报 几 个 斜率 值 ,然后 将 它们 
作 线性 组 合 (即将 它们 加 权 平 均 ) 作 为 平均 斜率 的 近似 值 , 则 可 能 构造 出 精度 更 高 
的 计算 公式 。 下 面 介绍 的 龙 格 - 库 塔 (Runge - Kutta) 法 就 是 这 样 一 种 方法 。 

2. 龙 格 - 库 塔 法 

下 面 以 三 阶 龙 格 - 库 塔 公 式 为 例 来 说 明 这 种 方法 。 

实际 上 , 欧 拉 公 式 是 一 阶 龙 格 - 库 塔 公 式 ( 其 局 部 截断 误差 为 OCh?)) ,改进 的 
欧 拉 公式 是 二 阶 龙 格 - 库 塔 公 式 , 其 局 部 截断 误差 为 O(h3)。 现 在 如 果 在 区 间 [z， 
ti+1j 上 再 增加 一 个 新 点 , 即 用 三 个 点 上 的 斜率 进行 加 权 平 均 ,作为 平均 斜率 的 近似 
值 ,可 望 得 到 局 部 截断 误差 为 O(h*) 的 三 阶 龙 格 - 库 塔 公 式 , 即 


Ki = ft, yi) 
Kz = ft ph, yi+ PhK1) 
Ks = f(t ah, y;+qhK:) 
yi = yi 二 ThAKi tA Kz +A KR) 
式 中 ;4,4 十 ph， ti 十 gh 为 区 间 [t, ti+1] 上 的 三 个 点 ;Ks 由 Ki 来 预报 , Ks 由 K; 
来 预报 ;4 , 4。 和 4 为 斜率 的 线性 组 合 系数 。 
下 面具 体 讨论 式 (9. 14) 中 参数 p,q, Al，)> 和 4 的 选择 。 
根据 泰勒 公式 ,对 式 (9. 14) 中 的 K1，K; ,和 Ks 在 (1;，y;) 点 展开 ,得 到 


Ki= f(t, y)=y (9. 15) 


(9.14) 


-136= 








Ks 一 7 十 负 , 十 加 K1) 一 Fa， 3) 十 曾 罗 十 去 大 二 OO) 


=y+ My tpih y+O) (9. 16) 
2 








Ks =f +t hs y+ ghKs) = fltis y1) + qhy + rh y+ Oe) 
=¥- hy + 到 ex 十 OCR) (9.17) 


将 式 (9. 15)(9. 16) 和 (9. 17) 代 入 式 (9. 14) 的 第 四 个 式 子 ,得 到 
yi = yi 十 h(i 十 hz 十 43)3 hphXs 十 gs) 允 十 
二 pr he + qh) y+ Oh) (9. 18) 


现在 如 果 直 接 对 y(z,) 用 三 阶 泰勒 展开 , 则 为 


oo 一世 十 包 秆 二 十 Ey, 十 DG) (9. 19) 
比较 式 (9. 18) 和 (9.19), 为 了 使 三 阶 龙 格 - 库 塔 公式 (9.14) 的 局 部 截断 误差 为 


O(h') ,参数 p,q, 和 4, Xz 和 应 满足 如 下 条 件 : 


+h+Xhs 一 1 
二 
AM:tA: 一 也 (9. 20) 
prs + gas = 二 
如 果 取 p 二 1/2 (中 点 ), g = 1 (终点 ), 则 方程 组 (9. 20) 变 为 
++ =1 
1 二 二 
2 二 如 二 苹 (9.21) 
二 + 入 一 





由 上 述 方程 组 解 出 A1, 4 和 3 为 
外 一 于 妨 一 全, 一 
综 上 所 述 , 可 以 得 到 三 阶 龙 格 - 库 塔 公式 为 


= 


天 = f(t, 
= f(t+ ys 名 ,十 到 4K) 
= f(t;h, yt hkK2) 


(9. 22) 
[sn = 十 二 CR 十 4Kz: 十 Ka) 


其 每 一 步 的 截断 误差 为 OCh’*)。 

如 果 在 三 阶 龙 格 - 库 塔 公 式 中 ,不 取 中 点 和 终点 的 斜率 ( 即 p 隆 1/2, gq 关 11)， 
而 取 [ii，tit1] 上 其 他 任意 两 点 的 斜率 ,就 可 以 得 到 各 种 不 同 的 三 阶 龙 格 - 库 塔 公 
式 。 如 取 p 二 1/3,g = 2/3, 则 有 

Ki = flti, yi) 


Ks = f(t 十 委 , yi 二 如 K1) 


9.23 
= f(t 二 部, y 十 分 K;) 人 
Yl = y+ 人 (Ki +3K) 
取 p 二 1/2, 9 二 3/4, 则 有 
K = f(ti, yi) 
Ks = f(s 二 各, y+ 入 K,) 
(9. 24) 


Ks= /f(s 十 台 ， 和 + 妆 K,) 
yin 一 世 十 二 (2K; 十 3Ks 十 4K) 


在 以 上 三 个 三 阶 龙 格 - 库 塔 公式 中 ,都 采用 了 由 Ki 预报 KK ,由 K; 预报 K; 的 
办 法 。 实 际 上 也 可 以 采用 由 Ki 预报 K: ,由 K! 和 Ks 共同 预报 Ks 的 办 法 。 例 如 
取 户 =1/2, g 一 1, 则 有 
Ky 一 :Fa yi) 
Ks = /5 十 全， 十 全 Ka) 
Ks = fl +h, y;—hKi +2hKs) 
yun 一头 十 二 CGK 十 4Ks 十 Ks) 


(9. 25) 














与 三 阶 龙 格 - 库 塔 公式 的 推导 类 似 , 可 以 推导 出 四 阶 龙 格 - 库 塔 公式 ,其 每 一 步 
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的 截断 误差 为 OF )。 如 


























经 典 公式 : 
Ki = f(t;, yi) 
Ka = f(u+ 各 ,y+ 各 K1) 
Ks = fbi 二 各, yi 十 委 K:) (9. 26) 
Ki = futh, y+hKs) 
yi = %+B(Ky +2K +2Ks + Ke) 
库 塔 公式 ， 
Ki 一 f(ti, yi) 
A h 
Ks = 7 十 二，y 十 二 KK ) 
Ks = fbui 二 你， y, 一 和 Ki 十 hK:) (9. 27) 
Ke = f+h, y+hKi —hKs +hKs) 
yi = yi 十 kK, + 3Ks 十 3K; + Ki;) 
3. 步 长 的 自动 选择 


在 微分 方程 的 数值 解 中 ,从 每 跨 一 步 的 截断 误差 来 看 ,显然 是 步 长 越 小 ,其 截 
断 误 差 就 越 小 (要 求 h 二 1)。 但 是 , 随 着 步 长 的 减 小 ,在 一 定 的 求解 区 间 内 所 需要 
走 的 步 数 就 增加 了 ,而 步 数 的 增加 ,不 但 会 引起 计算 量 的 增 大 ,并 且 会 引起 伟人 误 
差 的 大 量 积累 与 传播 。 因 此 ,微分 方程 的 数值 解 与 数值 积分 一 样 , 也 有 一 个 选择 步 
长 的 问题 。 下 面 就 这 个 问题 进行 分 析 。 

1) 如 何 衡量 和 检查 计算 结果 的 准确 程度 

以 四 阶 龙 格 - 库 塔 公式 为 例 。 设 >(#) 是 已 知 的 且 是 精确 的 ,然后 考虑 由 y(zi) 
计算 y++ 时 的 截断 误差 。 

用 y 入 表示 当 步 长 为 六 时 ,由 y(t;) 算 得 ti 点 值 。 此 时 ,由 二 跨 一 步 至 ti41。 

用 y% 人 ?表示 当 步 长 为 h/2 时 ,由 y(i) 算 得 i 点 的 y 值 。 此 时 ,由 4 跨 两 步 
至 t+ 
由 yliit1) 算 得 +! 点 的 精确 值 。 
根据 四 阶 龙 格 - 库 塔 公式 ,每 跨 一 步 的 截断 误差 为 O(hs), 则 有 


ytin) — YH = Oh’) 
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ye 20[($)] 


由 上 两 式 可 以 得 到 


yt) CO— yh 


(h/2) 


一 一 一 a 16 
y(t) — yA 


由 此 可 以 解 出 


(h/2) 名) 


Ytin) 一 2 生 吉 G% 一 只 
上 式 表明 ,在 微分 方程 数值 解 中 ,用 龙 格 - 库 塔 公式 算得 某 一 点 的 解 函数 值 与 其 精 
确 值 之 差 可 以 用 步 长 h 与 /2 计算 得 到 该 点 的 两 个 数值 之 差 来 估计 。 

2) 如 何 根据 对 结果 的 精度 要 求 来 处 理 步 长 

根据 以 上 对 误差 的 估计 ,并 考虑 到 舍 入 误差 和 积累 对 结果 的 影响 ,可 以 用 如 下 
的 过 程 来 选择 合适 的 步 长 。 

首先 ,将 求解 区 间 [a, bjn 等 分 , 即 h 二 (5 一 a)/n。 

然后 ,根据 龙 格 - 库 载 公式 以 h 为 步 长 由 y; 计算 yn , 即 计算 yi% ;再 以 h/2 为 
步 长 , 跨 两 步 由 yy; 计算 yt, 即 y%?。 

令 

A 一 | 一 其: 


车 A 过 e, 则 反复 将 步 长 加 倍 ,直到 A > s 为 止 ,再 将 步 长 折 半 一 次 计算 ; 若 A 之 e， 
则 反复 将 步 长 折 半 进行 计算 ,直至 A 二 为止。 

[ 例 9-3] 应 用 经 典 龙 格 - 库 塔 法 计算 反应 器 的 温度 分 布 。 已 知 在 管 式 反应 
器 内 进行 液 相 反应 A = R 十 S, 该 反应 为 吸 热 反 应 ,所 需 热 量 由 管 外 油 浴 供 给 , 油 
温 为 340'C 。 实 验 确定 反应 温度 与 转化 率 的 关系 为 


dt 
dra 








65.0—15.58(t—t.)/k(l— zr) 


式 中 :反应 速率 常数 二 1. 17X10'exp( 一 44500/(RT)), RR 二 1. 987, 反应 器 壁 温 
大 一 340'C。 若 反 应 器 入 口 温 度 to 二 340C ,入口 转化 率 zm 二 0, 要 求 反 应 器 出 口 
转化 率 为 zw 一 0. 90, 试 确定 不 同 转化 率 下 反应 器 的 温度 。 

由 题 意 知 , 这 是 个 初 值 问题 。 
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下 65.0 一 15.58(z 一 340)/R(1 一 ZA)， xa € [0, 0.9] 
A 


k=1.17xX10"exp[— 2.24X 10:/(:+273.15)] 








t = 340 


令 y 一 收工 = zA, 取 步 长 h 一 0.05, 应 用 龙 格 - 库 塔 法 可 求 出 结果 。 表 9-2 
列 出 部 分 数据 。 


表 9-2 [ 例 9-3] 的 部 分 数据 




















zh 0.1 0.2 0.3 0.4 0.5 
uC 333.94 | 329.19 | 326.26 325. 11 325. 27 
xA 06 | 07 | os 0.9 

/°C 326. 26 327. 85 330. 02 333. 21 








由 以 上 数据 可 知 ,反应 初期 反应 速率 快 , 油 浴 供 热 不 足 , 故 温度 迅速 下 降 ; 反 应 
中 期 反应 速率 有 所 减 慢 , 供 热 速 率 与 热 消耗 速率 基本 持平 ;反应 后 期 ,反应 速率 进 
一 步 减 慢 , 供 热 速 率 大 于 热 消耗 速率 , 故 温度 逐渐 回升 。 


第 五 节 用 MATLAB 求 常 微分 方程 的 数值 解法 


1. 改进 的 欧 拉 法 
在 MATLAB 中 没有 专门 针对 欧 拉 法 的 函数 ,因此 应 用 改进 的 欧 拉 法 要 先 编 
写 算法 M 文件 。 根 据 式 (9. 11) ,给 出 如 下 的 M 文件 : 
eulerl.m 
function [x,yj 二 eulerl(fun,x0,xn,y0,n) ”%(x0,y0 为 初 值 ,把 区 间 分 成 n 
等 分 ) 
h=(xn—x0)/n; 
fori=1:n 
yp=y0+h* feval(fun, x0,y0); 
x0 一 x0 十 h; 
yc 一 y0 十 h x* feval(fun, x0,yp); 
y0 一 (yp 十 yc)/2; 
x(i) =x0; 
y()=y0; 
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end 
2. 龙 格 - 库 塔 法 
MATLAB 中 专门 提供 了 几 个 采用 龙 格 - 库 塔 法 来 求解 常 微分 的 函数 ,它们 是 : 
ode23，ode45，odel13，ode23s，odel5s 等 。 下面 主 要 介绍 最 常用 的 ode23 和 
ode45 这 两 个 函数 。 
在 MATLAB 中 ,与 二 阶 和 三 阶 龙 格 - 库 塔 公式 相对 应 的 函数 是 ode23，ode23 
函数 的 调用 格式 为 
[T,Y]=ode23( F',TSPAN, Y0,options) 
式 中 :F 定义 此 微分 方程 的 … 形 式 y 二 F(t,y); 函数 F(t,y) 应 当 返 回 一 列 向 量 ， 
TSPAN=[To TFINAL] 表 示 此 微分 方程 的 积分 限 是 从 To 到 TFINAL, 它 也 可 以 
是 一 些 离散 的 点 ,形式 为 TSPAN= 二 [TO Tl … TFINAL]。Yo0 为 初始 条 件 。 
options 为 积分 参数 ,如 设置 积分 的 相对 误差 和 绝对 误差 , 它 可 由 函数 odeset 来 
设置 。 
在 MATLAB 中 ,与 四 阶 和 五 阶 龙 格 - 库 塔 公式 相对 应 的 函数 是 ode45,ode45 
函数 的 调用 格式 为 
[T,Y]=ode45(F' ,TSPAN,Y0,options) 
式 中 参数 的 含义 与 ode23 的 相同 。 
[ 例 9-4] 在 MATLAB 中 求解 [ 例 9- 3]。 
首先 编写 常 微分 方程 的 M 文件 , 取 名 为 lk. m。 
function {=Ik(x,y) 
{=—65. 0—15. 58 x (y 一 340)/(1. 17el7 x exp( 一 2. 24e4/(y 十 273. 15)) * 
(1 一 x))5 
用 改进 的 欧 拉 法 求解 : 
>>[x,y]=eulerl( lk',0,0. 9,340,18) 
x= 
0.0500 0.1000 0.1500 0.2000 0.2500 0.3000 0.3500 
0.4000 0.4500 0.5000 0.5500 0.6000 0.6500 0.7000 
0.7500 0.8000 0.8500 0.9000 
y= 
336. 8516 333. 9442 331. 3643 329.1930 327.4864 326.2605 
325. 4883 325. 1123 325.0621 325.2708 325.6842 326. 2636 
326. 9867 327. 8460 328. 8496 330. 0250 331. 4318 333. 2052 
用 二 阶 和 三 阶 龙 格 - 库 塔 法 求解 : 
>>[x,y]=ode23C Ik',[0:0. 05:0. 9],340); 
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340 
338 
336 
334 
332 
330 
328， 
326 
32: 


>>[x,y] 


ans 一 


0 0. 0500 0. 1000 
0. 3500 0.4000 0. 4500 
0. 7000 0.7500 0. 8000 
340. 0000 336. 8416 
327. 3943 326. 1403 
325. 1410 325. 5674 
328. 7539 329. 9136 


0. 1500 
0. 5000 
0. 8500 


333. 9189 
325. 3559 
326. 1636 
331. 2677 


0. 2000 0. 2500 0. 3000 
0. 5500 0. 6000 0. 6500 
0. 9000 
331. 3204 329. 1240 
324. 9672 324. 9235 
326. 8925 327.7617 
333. 0046 


如 在 MATLAB 命令 窗口 中 输入 如 下 命令 : 


ode23( lk',[0 : 0.05 : 0.9],340) 


则 MATILAB 会 把 计算 得 出 的 结果 以 图 形 的 形式 给 出 ( 见 图 9- 2)。 
[ 例 9-5] 用 MATLAB 求 解 [ 例 9-1]。 式 中 r==1,a=0.1,6==0.5,c= 
0.02, zx! 和 xs 的 初 值 分 别 为 25 和 2, t 的 终 值 为 15。 


先 将 [ 例 9- 1]j 的 方程 组 化 为 











4 二 
0.0 02 0.4 0.6 


图 9-2 [ 例 9-3] 方 程 数值 解 的 图 形 表示 


| 


dr 
dt 


编制 方程 的 M 文件 如 下 : 
prey. m 


function xdot=prey(t, x) 





一 0. 1;b=0. 5;c=0. 02; 








100 -一 
90 1(0) 
80| 
70| 
60 
50| 
40 
30 
20| 2(0) 
10 
0 E 10 15 


图 9- 3 食 饵 -捕食 者 模型 数值 解 的 图 形 表示 


0 J 
—b+ceri 


xdot 一 [r 一 ax x(2) 0;0 一 b 十 cx x(1)] x* x; 
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preyl.m 

[t,x]=ode45( prey',[0 : 0.1: 15],[25 2]); 

plot(t, x); 

gtext( x1(t)') 

gtext(' x2(t)') 

在 MATLAB 命令 窗口 输入 preyl, 可 得 如 图 9 - 3 所 示 的 解 。 

对 于 高 阶 微分 方程 初 值 求解 ,可 和 上 例 的 一 阶 微分 方程 组 作 类 似 处 理 , 先 转化 

为 一 阶 微分 方程 组 ,再 写 为 矩阵 形式 的 微分 方程 ,采用 常用 求解 方法 。 

[ 例 9-6] 求解 一 5y 十 6y 一 0,y(0) 一 1,y (0) 1s 

令 z 二 dy/dt, 则 y= 二 dz/dr, 得 到 
dy/dt=z,y(0)=1 
dz/dt=5z—6y,z(0)=—1 








令 Y= >] 
oa [Se]=[ =-[ = 记 ] 


本 章 学 习 要 点 : 

(1) 了 解 欧 拉 方 法 及 其 计算 。 

(2) 了 解 改进 欧 拉 方 法 及 其 计算 。 

(3) 了 解 龙 格 - 库 塔 公式 的 应 用 。 

(4) 使 用 ode23，ode45 求解 常 微分 方程 。 
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第 十 章 ， 生 物 统计 学 基础 


实验 事件 是 一 个 随机 过 程 , 生 命 科 学 中 的 任何 实验 过 程 也 是 随机 过 程 。 由 于 
每 次 实验 的 结果 都 带 有 一 定 程度 的 偶然 性 ,有 随机 误差 等 的 存在 ,但 是 其 多 次 重复 
实验 的 结果 变化 能 够 反映 一 定 的 统计 规律 。 众 多 生物 实验 数据 处 理 就 是 对 实验 数 
据 的 误差 和 特性 进行 分 析 , 应 用 概率 和 数理 统计 的 知识 对 实验 数据 用 统计 方法 找 
出 规律 ,得 到 数学 模型 ,并 对 数学 模型 进行 检验 。 生 物 统计 学 是 生物 数学 领域 中 应 
用 最 早 也 是 最 为 广泛 的 学 科 , 是 一 门 运用 数理 统计 的 原理 和 方法 分 析 和 解释 生命 
科学 中 各 种 现象 和 检验 调查 资料 的 科学 ,作为 生物 学 研究 和 实验 数据 处 理 的 一 个 
基础 工具 ,已 越 来 越 受 到 生命 科学 家 的 重视 。 

合理 的 实验 设计 也 是 以 具体 实验 的 发 生 概 率 为 基础 进行 设计 的 。 因 此 ,对 于 
生物 统计 学 来 说 ,了 解 概率 和 数理 统计 的 知识 是 不 可 缺少 的 。 


第 一 节 ”随机 变量 的 分 布 


一 、 随 机 变量 的 分 布 函 数 


1. 概率 函数 和 概率 密度 函数 
要 完整 地 掌握 一 个 随机 变量 ,必须 了 解 随机 变 
量 的 各 种 可 能 值 的 概率 , 即 需 了 解 随 机 变量 的 概率 
分 布 ,了 解 其 概率 分 布 密度 。 随 机 变量 X 的 概率 分 
布 可 以 用 分 布 函 数 F(z) 表 示 , 或 用 随机 变量 的 概率 
分 布 图 (图 10 - 1) 表 示 , 所 有 的 概率 分 布 函数 都 必须 
满足 归 一 化 条 件 。 公 式 如 下 : 
P(r) = P(X) 图 10- 1 随机 变量 的 概率 
Fr 一 co) =0, F(z=0%)=1 分 布 曲 线 
对 于 离散 型 随机 变量 , 即 其 随机 变量 X 的 值 是 不 连续 的 ,如 血液 中 的 红血球 
数 和 白血球 数 等 。 它 的 概率 密度 函数 和 分 布 函 数 表示 为 


plz) = P(X = Zz) 
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F(z) = Dplz) 


一 


并 且 满 足 : 





plxi) = F(xi)— F(xri) 
pz) 一 Fr 一 co) 一 1 
对 于 连续 型 随机 变量 , 即 其 随机 变量 X 的 值 是 连续 的 ,如 分 子 的 运动 速度 ,一 
个 地 区 的 男性 身高 分 布 等 。 它 的 概率 密度 函数 和 分 布 函数 为 


p(x) 一 此 


P(rz<X<zr+dr)= p(xr)dr 


Fw = pr)dr 


并 且 满足 |”p(z)dz = Frz = =) = 1。 


2. 联合 概率 分 布 

对 于 两 个 或 更 多 的 随机 变量 ,必须 研究 随机 变量 X、Y、2 等 的 联合 概率 分 布 ， 
即 需 了 解 随机 变量 的 联合 分 布 函数 。 

以 两 个 随机 变量 X、Y 为 例 ,定义 连续 型 随机 变量 X 和 YY 的 联合 分 布 函数 ， 


Fr y) = P(X<zr,Y<y) 


其 联合 概率 密度 函数 为 


一 oF(r, y) 
plr, y) 本 
概率 函数 : 
rtdr fytdy 
P(rz<X<zrtd y<Y<ytdy = | plz, Wdzdy 
zy 
而 离散 型 随机 变量 X 和 YY 的 联合 概率 函数 为 
plr, y) = P(X=7x,Y=y) 


可 将 上 述 定义 推广 到 多 个 随机 变量 的 情况 。 定 义 n 维 随机 变量 (Xi,X:,，…,，X,) 
的 联合 分 布 函 数 为 
Fl(ri, xz， …， To) 一 户 X 委 mv X, Cr,) 
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或 
Fon za 2) = oo) peas ny)dridzredm 
而 离散 型 n 维 随机 变量 (X! ，Xs，…，X, ) 的 联合 分 布 密度 函数 为 
plxis x2s ,Ta) = p(X = T,X, = 7 ) 
nn 维 随机 变量 (X, ，X。，…，X, ) 的 联合 分 布 函数 的 归 一 化 条 件 为 


[pn Ne EE A Ee 


二 、 正 态 分 布 


正 态 分 布 是 最 常见 的 连续 型 随机 变量 分 布 , 正 态 分 布 随机 变量 的 概率 密度 函 
数 为 





A 1 (rs 
/= 一 二 on[ 27 ] (oo<r<™) 
正 态 分 布 的 分 布 函数 为 








a 1 一 (z 一 上 31 
Fo = 上 一 二 ee[ Fd (一 -<a<<co) 

正 态 分 布 又 称 为 高 斯 分 布 , 它 有 两 个 特征 参数 , 即 数 学 期 望 wk 和 方差 o? (c > 
0)。 当 随机 变量 x 服从 数学 期 望 为 wk 和 方差 为 a 的 正 态 分 布 时 ,常用 一 N(Ap， 
0 ) 或 者 x 一 Np， o) 来 表示 。 对 于 随机 变量 z+ 一 N(y, 到 ) 的 正 态 变量 x 作 线性 变 
换 , 令 “= 一 “， 就 可 以 得 到 标准 正 态 分 布 u~N(0, 1)。 从 而 可 以 利用 标准 正 态 
分 布 数 值 表 ( 见 附录 ) 进 行 分 布 函 数 的 计算 。 当 xz 一 NC, 0),xz 值 落 在 区 间 (w 一 
yo, py 十 Yo) 内 的 概率 ,可 按 以 上 公式 求 得 ,数据 如 表 10 - 1 所 示 。 

表 10-1 区 间 概 率 


1.000 ] 









1.645 ] 1. 960 | 2. 000 | 2.576 | 3.00 














0. 683 0.997 3 


plp—Yo, pt yo) 


从 正 态 分 布 概率 密度 函数 曲线 (图 10 - 2) 中 可 以 得 到 该 曲线 有 以 下 的 四 个 特 
征 :@ 曲 线 为 单 峰 性 ;@ 曲 线 为 对 称 性 ;GD)z 在 士 c 处 曲线 存在 拐点 ;@ 当 zx 一 土 % 
时 , 记 (z) 一 0。 

许多 生物 数据 的 分 布 服从 正 态 分 布 ,如 [ 例 10-1] 中 的 人 身高 分 布 。 
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人 
2 
图 10-2 正 态 分 布 概率 密度 函数 曲线 


[ 例 10-1] 在 某 地 随机 选取 100 名 成 年 人 ,分 别 记 录 他 们 的 身高 结果 (cm)， 
数据 如 表 10 - 2 所 示 。 


表 10-2 [ 例 10-1] 中 的 身高 结果 


162 166 171 167 157 168 164 178 170 152 
158 153 160 174 159 167 171 168 182 160 
159 172 178 166 159 173 161 150 164 175 
173 163 165 146 163 162 158 164 169 170 
164 179 169 178 170 155 169 160 174 159 
168 151 176 164 161 163 172 167 154 164 
153 165 161 168 166 166 148 161 163 177 
178 171 162 156 165 176 170 156 172 163 
165 149 176 170 182 159 164 179 162 151 
170 160 165 167 155 168 179 165 184 157 


将 以 上 数据 整理 后 ,可 以 得 到 表 10 - 3 中 的 身高 分 组 频次 。 
表 10-3 身高 分 组 频次 





























身高 上 
FW | 150 以 下 | 151 一 155| 156~160 | 161~165 | 166~170| 171~175 | 176~180 | 180 以 上 
频次 | 4 | 8 | 1s 26 22 11 11 3 








如 果 将 分 组 频次 表 按 统计 学 上 常用 的 直方 图 、 频 率 分 布 图 或 多 边 图 等 的 形式 
表示 ,可 以 发 现 其 分 布 接近 正 态 分 布 , 符 合 正 态 分 布 的 各 个 特性 。 
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二 节 ”随机 变量 的 数字 特征 一 一 数学 期 望 和 方差 


对 于 一 个 随机 变量 的 描述 ,用 分 布 函数 即 可 说 明 其 性 质 。 但 是 在 实际 的 工程 
技术 问题 上 ,只 需要 了 解 随机 变量 的 数学 期 望 和 方差 。 如 上 述 的 几 种 随机 变量 分 
布 在 了 解 其 随机 变量 的 数学 期 望 和 方差 后 , 即 可 了 解 随机 变量 的 总 体 分 布 状况 。 

一 个 随机 变量 可 以 取 不 同 的 数值 ,但 是 该 随机 变量 所 有 的 取 值 总 是 在 随机 变 
量 的 平均 值 周围 ,这 个 平均 值 反 映 了 随机 变量 变化 的 集中 趋势 。 这 个 平均 值 即 称 
为 随机 变量 的 数学 期 望 。 而 方差 表示 随机 变量 的 离散 特征 。 因 为 仅仅 知道 随机 变 
量 的 分 布 中 心 位 置 , 即 数学 期 望 还 不 够 ,它们 不 可 能 显示 随机 变量 的 各 个 值 如 何 围 
绕 在 中 心 周围 进行 分 布 。 为 了 研究 随机 变量 的 离散 程度 ,引入 方差 代表 随机 变量 
离散 性 的 综合 指标 。 

方差 的 定义 : 

D(x) = E[x — E(x)J 


它 表示 随机 变量 和 其 数学 期 望 的 差 的 平方 的 数学 期 望 。 
由 于 方差 的 因 次 是 随机 变量 因 次 的 平方 , 故 在 实际 应 用 中 ,常常 遇 到 的 是 方差 
的 平方 根 ,通常 称 为 均 方差 或 标准 差 : 


azr) = [Dn]? 


所 以 也 可 用 (zx) 表示 方差 , 即 D(x) 一 吧 (z) 

因为 方差 代表 随机 变量 的 离散 程度 ,方差 愈 大 ,表示 随机 变量 的 值 在 其 数学 期 
望 左右 分 布 得 愈 宽 , 愈 不 集中 ;反之 ,方差 愈 小 ,表示 随机 变量 的 值 在 其 数学 期 望 左 
右 分 布 得 愈 集中 。 因 此 ,只 要 知道 随机 变量 的 方差 和 数学 期 望 ,就 可 以 基本 了 解 随 
机 变量 的 分 布 位 置 和 分 布 范围 。 

对 于 离散 型 随机 变量 , 它 的 数学 期 望 : 


E(x) = >)ziP(Cri) 


式 中 :E(z) 表 示 随 机 变量 zx 的 数学 期 望 ,zx; 为 随机 变量 可 能 的 取 值 , P(z;) 为 相应 
的 概率 。 它 的 方差 : 


D(z) = 沁 [rz—ECDJp(z;) 


对 于 连续 型 随机 变量 , 它 的 数学 期 望 和 方差 分 别 为 
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E(xz) 一 [三 zp(lxz)dr 
D(z) = | [z 一 ECz)]pCz)dz 
对 于 nn 维 随机 变量 (zx ，zz，…，z*) ,为 了 表征 任意 两 个 随机 变量 之 间 的 相关 
程度 ,定义 协 方差 为 
Cov(zxi, x;) = E[(zx;— E(x;))(z; — E(zx;))] 
= — Ez) (x — Ex) pr, zoes es xz) dr dre'dz, 


如 果 协 方差 Cov(x;, zj;) = 0, 表示 两 个 随机 变量 之 间 不 相关 。 也 可 以 用 相关 
系数 p(x;， zz ) 表 示 其 相关 程度 ,定义 相关 系数 为 
Cov(xi, x)) 
oxi)a(z)) 

根据 方差 的 定义 ,显然 一 1 二 plzi, zj) 三 1。 如果 plzi, zz) 二 0, 表示 两 个 随 
机 变量 之 间 不 相关 。0 过 | o(z， zj)) | 二 1, 表示 两 个 随机 变量 之 间 部 分 相关 。 
| plxi, zj) | 三 1, 则 表示 两 个 随机 变量 之 间 全 相关 ,而 对 于 同一 个 变量 , p(x;， 
Zj) 三 1。 p(xi, Xx)) 为 正 值 ,表示 正 相 关 ; 反 之 ,p(xi;， zj; ) 为 负 值 ,表示 负 相 关 。 





plxi Ti) 一 


第 三 节 ”样本 的 特征 值 和 常见 分 布 


在 统计 学 中 ,随机 过 程 的 数学 处 理 是 用 子 样 (或 样本 ) 的 统计 特性 来 估计 总 
体 (也 称 母 体 , 即 随机 过 程 ) 的 统计 特性 。 设 XX 为 具有 分 布 函数 F(z) 的 随机 变 
量 ,如 果 XI ，X:，…，X, 为 具有 同一 分 布 函数 F(z) 的 相互 独立 的 随机 变量 , 则 
称 X ，X: ，…，X, 为 从 分 布 函数 F(z) 得 到 的 容量 为 ”的 样本 。 它 们 的 观测 值 
2 2 称 为 XX 的 个 独立 观测 值 或 样本 的 实现 。 对 于 一 个 随机 变量 的 
样本 Xi，X。,，…，X,, 可 从 子 样 的 性 质 推测 其 总 体 的 性 质 ,包括 数学 期 望 和 


一 、 样 本 的 平均 值 和 方差 
如 上 所 述 ,随机 变量 的 数学 期 望 及 方差 可 从 子 样 样本 的 特性 推测 , 子 样 的 特性 
归纳 为 子 样 均值 一 一 十 2 它 是 母体 均值 的 无 偏 估计 。 


二 人 = 











子 样 的 方差 5 1 Cr z)? 1 Dx 了 丈 ， 它 是 母体 方差 的 有 偏 估计 。 





而 = 一 y (zx 一 z)? 则 是 母体 方差 的 无 偏 估计 。 
1=1 


ED 


它们 两 者 相应 的 标准 差 : 





二 、 重 要 的 统计 分 布 


1. 上 分 布 
L 分 布 又 称 为 学 生 分 布 , 是 一 种 连续 型 随机 变量 的 概率 分 布 。 令 Z 和 是 独 
立 的 随机 变量 ,y 为 X*(n) 分 布 ,Z 为 N(0,1) 正 态 分 布 ,定义 新 变量 : 





二 


Vy/n 


i 即 是 自由 度 为 n 的 变量 。 
4 的 概率 密度 函数 : 


( 叶 ) 
p(n) = et tPF/ (Ait+e) 
上 分 布 的 概率 分 布 函数 : 
下 (ti) = plDdt 
t 分布 的 数学 期 望 : 
MD =p=0 (n> 
t 分 布 的 方差 : 





PD) = (n>2) 
生 过 


1( 一 之 1<< oo) 分 布 的 概率 密度 函数 p(t) 是 单 峰 形 单调 和 左右 对 称 的 偶 函 
数 (图 10 - 3), 当 自由 度 很 大 时 ,分布 接 近 于 标准 正 态 分 布 N(0, 1)。 


Tl 


FU) 








Er er er EL i 了 0 


10- 3 1 分 布 的 概率 密度 和 概率 分 布 函 数 





2. 和 分布 
六 分 布 是 连续 型 随机 变量 X? 的 一 种 概率 分 布 。X 变量 的 概率 密度 函数 : 
0, X<0 
pW =1— Lie (xX>0) 
2 全 
式 中 :y( 号 ) 为 伽 玛 函数 ,m 为 X? 变量 的 自由 度 。 
x 的 概率 分 布 函数 
Fw = 六 pdx 
多 分 布 的 数学 期 望 ， 
MX) 一 je =n 
x 分 布 的 方差 
FX) 一 2n 


X 分 布 的 概率 密度 和 概率 密度 分 布 见 图 10 - 4。 








3. 下 分 布 
下 分 布 是 一 种 广泛 应 用 广泛 于 统计 学 的 分 布 ,F 变量 也 是 一 种 随机 变量 , 它 的 
定义 是 








_ xx/n 
Fo zm 
式 中 :zk 和 zs 为 彼此 独立 的 zx? 变量 ,nt 和 nz 分 别 为 zx 和 zx 的 自由 度 ,分 别称 为 
第 一 和 第 二 自由 度 。 
下 变量 的 概率 密度 函数 : 
Ym + n2) /2 Cm /na) "rm? 
p(x) = 忆 72) Cra/ aL Cn cfr) J (过 0) 
° (r=<0) 
下 变量 的 概率 分 布 函数 : 
FF 
F(x) = | plr)dr 
下 变量 的 数学 期 望 : 
M(xz) = 时 (nz > 2) 
下 变量 的 方差 : 


一 -2 到 (mm tn — 2) 
ey 全 盖 人 


其 概率 分 布 和 概率 密度 分 布 图 参见 图 10 - 5。 


Pr) m=20 





图 10-5 下 分 布 的 概率 密度 和 概率 分 布 函 数 


mje 


三 、 其 他 常用 的 统计 量 分 布 


1. 大 样本 统计 平均 值 * 的 分 布 
设 总 体 的 均值 为 ,方差 为 ,根据 概率 论 的 中 心 极 限定 理 ,的 分 布 基本 接近 


于 正 态 分 布 N (jp, 邱 )。 
它 的 数学 期 望 为 M(Y) 一 / 方差 为 7) 一 所 。 


c(Z) 的 估计 值 SCZ) 还 称 为 标准 差 ,可 以 用 于 判断 两 组 样本 数据 之 间 的 显著 性 
2. 总 体 为 正 态 分 布下 的 样本 统计 平均 值 z 与 标准 差 s 的 分 布 


设 总 体 分 布 为 正 态 分 布 N(x, oj) ,那么 的 分 布 为 正 态 分 布 Ni 二)。 
如 为 自由 度 等 于 一 1 的 分 布 , 昌 Z 与 x* 独立 。 


另外 ,到 Vn 一 1 服从 自由 度 等 于 一 1 的 1 分布 。 

3. 两 个 相互 独立 的 正 态 分 布 Ni (jn ，ci)，N: (jz，o3) 的 平均 值 ,元 之 间 
的 分 布 与 方差 si. 53 之 间 的 分 布 

L 2 mna(m 二 nn 一 2) 。 (ZT1—72)— (pC— pp) 

当 呈 一 上 时， 于 到 的 服从 自由 度 等 于 
十 nz 一 2 的 上 分布 。 


而 二 服从 自由 度 等 于 由 一 1 和 思 一 1 的 正 分布。 








第 四 节 参数 估计 


从 以 上 的 随机 变量 分 布 可 知 ,只 要 知道 随机 变量 分 布 的 特征 值 等 几 个 参数 ,就 
可 以 确定 该 分 布 。 如 在 正 态 分 布 中 ,只 要 确定 其 期 望 值 和 方差 。 在 X? 分 布 中 ,只 
需 知道 其 分 布 的 自由 度 , 它 的 分 布 函数 就 能 定 下 来 。 

参数 估计 就 是 通过 实测 样本 来 估计 随机 变量 分 布 参 数 的 数值 和 推断 这 种 估计 
的 误差 。 参 数 估计 分 为 点 估计 和 区 间 估 计 。 从 一 组 样本 数据 估计 总 体 的 参数 值 ， 
计算 得 到 参数 的 一 个 特定 数值 , 称 为 点 估计 , 它 是 一 种 求 得 未 知 的 单个 参数 数值 的 
方法 。 区 间 估计 是 对 一 个 未 知 参数 给 出 一 个 随机 区 间 , 了 解 参 数 真 值 的 可 靠 范围 ， 
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并 求 得 在 该 随机 区 间 内 含有 参数 真 值 的 概率 。 这 个 概率 称 为 置信 概率 ,相对 应 的 
随机 区 间 称 作 置信 区 间 。 


一 、 点 估计 


计算 点 估计 有 不 同 的 方法 ,如 矩 估 计 法 、 极 大 似 然 估计 法 等 ,因此 也 有 不 同 的 
估计 值 。 一 般 希 望 随机 变量 的 点 估计 值 具有 以 下 的 性 质 。 

(1) 点 估计 值 应 该 是 无 偏 的 。 

(2) 点 估计 值 应 该 具有 最 小 的 方差 ,也 就 是 最 有 效 的 。 

(3) 点 估计 值 具 有 一 致 性 ,对 于 大 样本 时 应 收敛 于 估计 值 。 

对 于 一 个 具有 概率 分 布 F(?) 的 随机 变量 y, 假 设 该 随机 变量 分 布 的 数学 期 望 
上 和 方差 均 是 未 知 的 。 如 果 该 随机 变量 y 的 一 个 容量 为 ”的 随机 样本 为 (yi ， 
2，…， yn) ,那么 该 随机 变量 总 体 的 数学 期 望 wx 的 点 估计 值 是 样本 的 平均 值 ; 








该 随机 变量 y 的 总 体 方差 o? 的 点 估计 值 是 样本 的 方差: 


st 
n—1 
可 以 证 明 样 本 的 平均 值 y 和 方差 s 是 随机 变量 分 布 的 数学 期 望 wk 和 方差 0 
的 无 偏 估 计 值 。 如 样本 的 平均 值 y, 根 据 数学 期 望 的 性 质 , 有 
Ey) =E(l Dy) lE(Dy) = 1DEY) = iD 


因为 每 个 测量 值 y; 的 数学 期 望 均 为 w, 因 此 7 是 数学 期 望 w 的 无 偏 估计 值得 以 
证 明 。 
对 于 样本 的 方差 ,同样 有 


Es) EY]|- ECD) Cy —3)’] 
其 一 于 - 7 




















1 i 
- IEL 2 六 一 2 丈 ] 


元 
一 二 [也 (2 十 o2) — ny +o/m)] 
1 


证 一 主 


(一 1)o 一 史 





= 


一 般 在 统计 学 上 , 称 (n 一 1) 为 平方 和 > (y 一 了 )? 的 自由 度 。 或 者 说 ,对 于 一 
个 有 个 测量 值 的 样本 , 它 的 自由 度 为 (n 一 1)。 

二 、 区 间 估 计 

在 已 知 随机 变量 的 分 布 后 ,一 个 参数 的 区 间 估 计 是 指 参数 的 估计 值 的 范围 ,以 
两 个 统计 量 表示 区 间 范 围 ,并 应 指出 在 该 区 间 内 包含 参数 真 值 的 给 定 概率 。 因 为 
从 数理 统计 中 ,必须 用 定量 的 方法 来 估计 某 个 区 间 内 包含 有 未 知 的 总 体 参数 的 肯 
定 程度 。 用 概率 方法 描述 , 即 要 确定 两 个 统计 量 0, 和 0, ,参数 9 在 此 区 间 的 概率 为 
1 一 a, 则 有 














P(0 <0<H)=1—a 


式 中 :区 间 0 三 9 过 b 是 参数 9 的 对 应 于 置信 概率 为 100(1 一 a) % 的 置信 区 间 ,0,， 
4 分别 是 置信 区 间 的 低 限 和 高 限 ,a 称 为 置信 水 平 。 
例如 ,假设 y 是 一 个 正 态 分 布 的 随机 变量 ,其 pO) 
数学 期 望 y 未 知 ,而 方差 已 知 。 如 果 它 的 一 个 
容量 为 n 的 随机 样本 的 平均 值 为 7, 则 将 其 表示 为 
标准 正 态 分 布 的 统计 量 


Fk ~ No, Ey 30-o -a 0 0 20 30¢ 


py Vn 9327 
用 概率 的 形式 表示 , 则 为 ( 见 图 10 - 6) | 


5 图 10- 6， 正 态 分 布 的 置信 概率 
P(r ESN -1 和 置信 区 间 


如 7 为 1.645, a 即 为 0. 10, 可 将 上 式 变 为 
P( 了 一 1.645o/ Vn SpS5+1.6450/ Yn) 一 1 一 wx 一 0.9 
即 当 置信 和 度 为 0. 10 时 ,或 置信 概率 为 100(1 一 c) ,参数 w 的 置信 区 间 为 
了 士 1. 645c/ Vn 


如 果 上 例 中 的 方差 未 知 ,那么 对 于 它 的 一 个 容量 为 n 的 随机 样本 ,可 计算 
得 样本 方差 ,其 统计 量 : 





Zk = 
s/Vn 
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用 概率 的 形式 表示 , 则 为 





3—p ee 
中 SAVT < 中 -: 
如 a 为 0.05, 若 nn 为 11, 那 么 其 自由 度 f=n 一 1 = 10, 可 从 i 分 布 表 (附录 2) 中 查 
得 i 为 2.23, 即 当 置 信和 度 为 0. 05 时 ,或 置信 概率 为 100(1 一 a) % ,参数 /的 置信 区 
间 为 
了 土 2.23s/ Vn 


对 于 参数 估计 ,其 结果 是 和 概率 显著 性 水 平 a 的 大 小 联系 在 一 起 的 ,a 越 小 则 
置信 概率 越 大 ,相对 应 的 置信 区 间 范 围 就 越 广 ,虽然 估计 数据 的 可 靠 程度 越 高 ,但 
是 估计 的 精度 较 低 。 因 此 在 实际 应 用 中 ,应 合理 选取 a 的 大 小 。 





第 五 节 假设 检验 


在 实际 的 生命 科学 及 生物 工程 问题 上 ,被 考察 的 随机 变量 的 分 布 函数 形式 在 
未 知 的 情况 下 , 须 对 其 总 体 分 布 作 一 些 假设 并 进行 检验 ,如 进行 实验 方法 的 效果 检 
验 、 某 个 品种 的 质量 检验 、 某 种 药物 的 疗效 检验 。 常 用 的 假设 检验 内 容 有 以 下 
几 种 : 

(1) 当 方 差 已 知 时 ,关于 平均 值 的 检验 。 

(2) 当 方 差 未 知 时 ,关于 平均 值 的 检验 。 

(3) 有 关 方 差 的 检验 。 

检验 过 程 包括 四 个 步骤 :提出 假设 , 设 原 假设 或 无 效 假设 H。 和 备 择 假 设 
有 Hi ,如果 否定 Ho 就 接受 Hi ;@ 确 定 显著 性 水 平 ;8 计算 概率 ;@ 检 验 是 否 接受 假 
设 , 确 定 Ho 或 HH 成 立 。 

进行 上 述 检 验 的 常用 检验 方法 有 四 种 :U, 1, 下 , X? 检验 。 

1. 吕 检验 

在 实际 过 程 中 ,许多 测量 值 都 服从 正 态 分 布 ,而 关于 正 态 分 布 的 检验 问题 , 即 
是 检验 正 态 分 布 的 两 个 特征 值 数学 期 望 y 和 方差 o?。 

UU 检验 就 是 在 方差 已 知 的 情况 下 ,关于 平均 值 的 一 种 统计 检验 方法 ,也 就 是 检 
验 其 平均 值 是 否 与 已 知 常数 jw 相符 合 。 

假设 y 是 一 个 方差 为 o* ,平均 值 7 为 未 知 的 子 样 , 要 求 检验 的 假设 为 


人 


式 中 :pw 是 原 总 体 的 平均 值 。 

QU 检验 的 检验 统计 量 为 
A 
of/ Vn 
式 中 :po 是 原 总 体 的 平均 值 ,o 是 均 方差 ,n 为 随机 样本 的 容量 ,5 是 原 总 体 的 平 
均值 。 

现 假设 总 体 平均 值 不 变 , 了 = po， 则 7 应 服从 正 态 分 布 N (jyo，o/Vn) ,检验 统计 
量 “应 服从 标准 正 态 分 布 N(0, 1)。 

如 果 设 定 显著 水 平 a 二 0. 05, 从 正 态 分 布 表 中 可 以 求 得 拒绝 域 为 | x | 1. 96。 
如 果 根 据 样本 计算 的 统计 量 | x | > 1. 96 时 , 即 拒绝 假设 ;反之 假设 正确 。 

UU 检验 还 可 以 用 于 检验 两 个 正 态 分 布 的 总 体 平均 值 是 否 相等 ,这 两 个 样本 分 
别 服 从 正 态 分 布 Nu ，amyVvm ) 和 Ne oz/Vnz), 总 之 U 检验 的 检验 方法 可 以 
概括 如 表 10 -4 所 示 。 

表 10-4 方差 已 知 时 总 体 平均 值 的 检验 


和 一 














被 检验 的 假设 检验 统计 量 拒绝 假设 的 判别 
(1) Ho:5 = po w= 23- (DD | ul> we 
(2) Ho:5 2 po o/ Vn (2) u <—u, 
(3) Ha:y < pm (Du>w 
(1 Po: 一 次 NP (D lul> wz 
(2) Ho:D 过 次 ER 中 (2) 一 一 
(3) Ho:D < mn (Du> wu, 

2. t 检 验 


如 果 总 体 分 布 的 方差 未 知 , 在 此 情况 下 关于 平均 值 的 统计 检验 可 以 采用 : 检 
验 。 和 U 检验 类 似 ,也 就 是 检验 其 平均 值 是 否 与 已 知 常数 jw 相符 合 。 一 般 在 样本 
较 小 时 均 采用 上 检验 。 在 生命 科学 上 由 于 试验 条 件 和 研究 对 象 的 限制 ,通常 的 样 
本 量 较 小 (如 小 于 30) ,因此 : 检验 的 应 用 特别 广泛 。 

假设 y 是 一 个 方差 o? 未 知 的 子 样 ,要 求 检验 的 假设 为 

Ho:y= po 

式 中 ;po 是 原 总 体 的 平均 值 。 

+ 检验 的 检验 统计 量 : t= 
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! 是 一 个 服从 自由 度 了 为 (一 1) 的 上 分 布 的 随机 变量 。 式 中 :pm 是 原 总 体 的 平均 


值 ,* 是 样本 平均 值 ,n 为 随机 样本 的 容量 ,7 是 原 总 体 的 平均 值 。 
+ 检验 的 检验 方法 和 U 检验 一 样 概括 如 表 10 - 5 所 示 。 


表 10-5 方差 未 知 时 总 体 平均 值 的 检验 














被 检验 的 假设 检验 统计 量 拒绝 假设 的 判别 
(1 Ho:5 = pm 1:= 了 一 和 C1 12 Ti 
(2) Ho:3 > 0 s/n (2) 1 <— to 
(3) Ha: pm (3) 上 > ton! 

如 果 of 一 中 
(1) Ho: = 区 1 一 一 了 一 六 (GD 1z| > we 
(2) Hu: 之 也 A/ 二 +2 (2) 1 <— to 
和 
(3) Huo:h 过 六 让 干 久 三 2 (3) 上 > ta 











[ 例 10-2] 某 湖泊 的 水 中 含 氧 量 ,常年 的 平均 数 为 4. 75 mg/L, 现 在 湖泊 中 
随机 取样 得 到 如 下 12 组 水 含 氧 量 数据 ,分 别 为 4. 53，4, 62，4. 09，4. 66，4. 58， 
5. 05，4. 98，4. 82，4. 88，4. 80，4. 64，4. 78 mg/L, 试 检验 该 次 抽检 的 数据 与 常年 
平均 值 有 没有 显著 差异 。 

由 于 本 例 中 随机 变量 的 方差 未 知 , 只 能 采用 : 检验 。 

3. 下 检验 

下 检验 是 用 于 对 实验 数据 的 方差 作 一 致 性 检验 ,用 于 检验 两 个 正 态 分 布 的 母 
体 的 方差 是 否 相 等 。 下 检验 被 经 常用 于 对 实验 数据 进行 线性 和 非 线性 回归 时 所 得 
的 数学 模型 进行 检验 ,检验 模拟 方程 和 估计 参数 的 显著 性 。 

从 两 个 正 态 分 布 的 母体 中 ,各 取 容 量 分 别 为 n, 和 ns 的 子 样 ,它们 的 自由 度 分 
别 为 (mi 一 1) 和 (mz 一 1)。 统 计量 下 二 中/ 号 是 一 个 服从 自由 度 分 别 为 (mm 一 1) 和 
(ns 一 1) 的 下 统计 量 。 

检验 假设 Ho :of = 2。 

如 果 由 样本 计算 的 下 之 Fz. mw n 或 者 下 过 Faww. om-v， 则 拒绝 假 
设 ;反之 接受 假设 。 式 中 : Fz. 6 1,5 ，Fa-ww, 0-1.m-， 分 别 为 显著 水 平 为 a、 
自由 度 为 (m 一 1) 和 (nz 一 1) 的 下 分 布 的 上 界 和 下 界 。 由 于 一 般 的 下 分 布 表 只 有 下 
的 上 界 值 ,F 的 下 界 值 可 以 根据 公式 计算 : 

1 


1 Fp 
of 





= 


下 检验 方法 如 表 10- 6 所 示 。 
表 10-6 正 态 分 布 方差 的 F 检 验 





被 检验 的 假设 拒绝 假设 的 判别 

(1) Ho:d = (DF> Fn. mim 或 F<Fawp. mi yb 
(2) Ho:d > (2) 下 > Fm 

(3) 本 :中 < (DF> Fm 








[ 例 10-3] 在 生化 实验 中 ,两 组 同学 均 采用 3,5 -二 克基 水 杨 酸 比 色 定 糖 法 
测定 同一 种 样品 的 总 糖 含量 ,分 别 得 到 如 下 数据 : 
A 组 的 样品 含量 (g/L): 12.08 13.12 11.87 12.45 13.04 12.68 
B 组 的 样品 含量 (g/L): 13.34 13.10 11.93 11.85 12.87 12.35 12.66 
试 比较 A、B 两 组 人 员 的 分 析 技 术 有 何 区 别 ( 取 a = 0.05)。 
本 题 通过 比较 A、B 两 组 实验 的 方差 差异 来 判断 两 组 人 员 的 分 析 技 术 差 异 。 
4. MX 检验 
x 检验 是 用 于 检验 一 个 正 态 随 机 变量 y 的 总 体 方差 是 否 等 于 某 一 个 常数 ,如 
已 知 方差 名 ,提出 要 被 检验 的 假设 为 
Ho:o = 
检验 统计 量 X? 为 


x = 2 -7 
oo 


它 是 一 个 服从 自由 度 f 二 n 一 1 的 X? 分 布 统计 量 。 
对 于 给 定 的 置信 水 平 a, 如 果 由 样本 计算 的 X? 二 X32. 一, 或 X? 一 we， 则 
拒绝 假设 。 其 他 的 X 可 参见 表 10 - 7 所 示 。 
表 10-7 正 态 分 布 方差 的 jo 检验 


被 检验 的 假设 检验 统计 量 拒绝 假设 的 判别 


Do- 









(1) Po:o 一 中 
(2) Po:o > 
(3) Ho :只 So 


(DX > Xr 或 xX < Xf 
(2) X < Xi 
(WKF>REs 






x 





x 检验 还 可 用 于 检验 测定 值 的 分 布 是 否 服从 正 态 分布 , 还 可 以 检验 实验 数据 
的 误差 分 布 函数 是 否 服从 正 态 分 布 ,从 而 检验 系统 误差 是 否 存在 。 
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在 生命 科学 实验 数据 中 ,X 检验 还 可 用 于 吻合 性 检验 ,通过 分 析 实 际 数 和 理 
论 数 是 否 符合 ,来 判断 实验 结果 和 理论 假说 是 否 符合 ,如 检验 遗传 实验 结果 是 否 吻 
合 孟 德尔 遗传 规律 、 自 由 组 合 定律 等 。 

[ 例 10-4] 为 研究 果 蝇 怒 叶 的 遗传 规律 ,进行 果 蝇 翅 叶 的 杂交 遗传 实验 ,就 
Vg -vg 基因 而 言 ,第 二 代 的 观测 结果 如 下 : 长 起 :416 个 , 短 翅 :135 个 , 共 551 个 。 

试 分 析 长 翅 与 短 翅 的 比例 是 否 符合 3 : 1( 取 a 一 0.05)。 

首先 提出 假设 Ho:O[ 观 测 值 ] 一 E[ 理 论 值 ] = 0, 即 两 者 无 差异 。 分 别 计算 


Q， 所 值 ,计算 x 值 ,一 般 取 避 。 一 吕 二 ,但 当 自由 度 为 1 时 , 取 驹 ， 
i=l 


I 








4 一 纯 一 +5, 于 是 得 到 克 ， 一 0.049, 而 在 自由 度 为 1 时, 双 
3. 84， 因此 接受 假设 ,认为 实验 结果 符合 3 : 1 的 假设 。 


第 六 节 ”MATLAB 统计 工具 箱 应 用 简介 


MATLAB 统计 工具 箱 几 乎 包括 了 数理 统计 方面 所 有 的 概念 ,理论 . 方 法 和 算 
法 ,功能 强大 ,可 和 常用 的 统计 软件 相 媲美 。MATLAB 统计 工具 箱包 括 概率 分 
布 ,方差 分 析 、\ 假 设 检验 、 分 布 检验 、 非 参数 检验 回归 分 析 、 判 别 分 析 、 主 成 分 分 析 、 
因子 分 析 ,系统 聚 类 分 析 、 均 值 聚 类 分 析 、 试 验 设计 ,决策 树 、 多 元 方差 分 析 、 统 计 过 
程控 制 和 统计 图 形 绘制 等 。 

本 节 主 要 介绍 在 概率 与 数理 统计 中 常用 的 语句 ,如 进行 统计 分 析 , 计 算 分 布 参 
数 的 估计 值 和 置信 区 间 ,提供 假设 检验 的 函数 。 


一 、 概 率 分 布 和 统计 


MATLAB 统计 工具 箱 能 够 计算 20 余 种 常见 概率 分 布 的 特征 参数 、 常 见 概率 
分 布 有 : 

正 态 分 布 (norm) ,X 分 布 (chi2), t 分 布 (t), 下 分 布 (f)。 

MATLAB 提供 5 类 函数 ,结合 概率 分 布 组 合 使 用 , 即 : 

概率 密度 函数 (pdf) ,概率 分 布 函数 (cdf) , 逆 概 率 分 布 (inv) ,均值 与 方差 (stat) 
和 随机 数 生成 (rnd) 。 

如 :p 王 normpdf(x,muysigma) 

p=tcdf(x,n) 
[m,v]=chi2stat(n) 


-Ot 


x 一 finv(P,nl,n2) 
X 一 normrnd(muysigmayn,1) 
例 : 随 机 数 的 生成 ,R= 二 normrnd(MU,SIGMA,[m n]) 或 R==normrnd(MU， 
SIGMA ,m,n),[m n]。m,n 是 指定 随机 数 R 的 行 数 m 与 列 数 n。 
R=normrnd(8,4,[3 4]) 
R= 
6. 2697 9. 1507 12. 7567 8. 6986 
T3377 3.4141 7. 8495 7.2532 
8. 5013 12.7637 9.3092 10. 9032 
也 可 用 通用 函数 求 各 分 布 的 随机 数据 
函数 random 
格式 y==random(' name', Al,A2,A3,m,n) 
Name 可 选择 分 布 ;A1，A2，A3 为 分 布 的 参数 ;m, n 指定 随机 数 的 行 和 列 。 
[ 例 10-5] 产生 12(3 行 4 列 ) 个 均值 为 2\ 标 准 差 为 0. 5 的 正 态 分 布 随机 数 
y=random(' norm',2,0.5,3,4) 
y= 
1.7058 2.0570 1. 9522 1. 3319 
3. 0916 2. 5334 1. 5838 2. 3572 
1.9318 2.0296 2. 1472 2. 8118 
MATLAB 常见 的 统计 型 描述 函数 见 表 10 -~ 8。 


表 10-8 MATLAB 常见 的 统计 型 描述 函数 





















描 述 





max 求 方差 

min 求 最 小 值 range 求 样本 极 差 
mean 求 平均 值 sort 升序 排列 
median sum 求 和 


求 协 方差 


[ 例 10-6] A=[132567] 
mean(A); 得 到 均值 一 4 
var(A); 方差 一 5. 60 
min(A); 最 小 值 王 1 
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二 、 参 数 估计 与 假设 检验 


1. 参数 估计 
MATIAB 中 有 计算 总 体 均值 .标准 差 的 点 估计 和 区 间 估 计 语 句 , 对 于 正 态 分 布 
[mu sigma muci sigmaci]=normfit(x,alpha) 
式 中 :x 是 样本 (数组 ) ,alpha 是 显著 性 水 平 (alpha 缺 省 时 设 定 为 0.05), 输 出 mu 
和 sigma 是 总 体 均值 和 标准 差 o 的 点 估计 ,muci 和 sigmaci 是 总 体 均值 x 和 标准 
差 o 的 区 间 估 计 。 
[ 例 10-7] x=normrnd(2,4,100,1); alpha 一 0. 05 
[mu sigma muci sigmaci]= normfit(x) 
从 随机 数 得 到 各 估计 值 及 区 间 为 
mu 一 2. 1917 
sigma 一 3. 4740 
muci 一 
1. 5024 
2. 8810 
sigmaci 一 
3. 0502 
4.0357 
MATLAB 统计 工具 箱 中 还 提供 了 一 些 具有 特定 分 布 总 体 的 区 间 估 计 的 命令 ,如 
指数 分 布 expfit, 泊 松 分 布 poissfit,Gamma 分 布 gamfit, Beta 分 布 betafit, 均 匀 分 
布 unifit 等 ,分 别 用 于 指数 分 布 .Possion 分 布 的 区 间 估 计 , 具 体 用 法 详 见 Matlab 
帮助 。 
2. 假设 检验 
常用 的 假设 检验 有 : 
《1) ttest: 对 单个 样本 均值 进行 上 检验 ,总 体 方差 未 知 : 
[h,p,ci] 王 ttest(x,muyalphaytail) 
(2) ztest: 对 已 知 总 体 方差 的 单个 样本 均值 进行 = 检验 : 
[h,p,ci]=ztest(x, mu,sigma,alpha, tail) 
tail 是 对 备用 假设 Hi 的 选择 : 
输出 参数 h 一 0 表示 接受 Ho ,bh 二 1 表示 拒绝 Ho,p 表示 在 假设 Ho 下 出 现 的 
概率 ,p 越 小 He 越 值得 怀疑 ,ci 是 yo 的 置信 区 间 。 
(3) ttest2: 对 两 样本 均值 差 进 行 ,检验 : 
[Lh,p,ci]=ttest2(x,y,alpha, tail) 
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x,y 为 两 个 不 同样 本 ,其 他 意义 同 前 。 
[ 例 10-8] x 一 normrnd(0,1,100,1) 
y=normrnd(0. 25,1,200,1) 
[h,p,ci]=ttest2(x, y) 
结果 ;h=1, p=0. 0373, ci 0. 4841 0.0148 
3，vartest2: 两 个 样本 相同 方差 的 检验 
格式 类 似 , 有 : 
H=vartest2(X,Y) 
H=vartest2(X,Y ,alpha) 
H=vartest2(X,Y ,alpha, tail) 
[H,PJ]=vartest2(...) 
[H,P,CI]=vartest2(...) 


三 、 常 用 统计 图 


常用 的 统计 图 有 如 下 形式 ,以 直观 地 表现 样本 及 其 统计 量 的 内 在 规律 。 
(1) 曲线 图 :plot(x,y); plot(xl,yl,x2,y2,... ), 用 法 和 前 同 。 
(2) 直方 图 :hist: 








[N,X]=hist(data, k) 
式 中 :k 表示 数组 data 的 区 间 等 分 数 ,N 为 返回 k 个 小 区 间 的 频数 ,X 为 返回 k 个 
小 区 间 的 中 点 。 
或 hist(data,k) 。 
数组 data 的 直方 图 ,k 缺 省 时 为 10( 见 图 10- 7)。 
40 一 -一 
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[ 例 10-9] data=[156 159 162 165 168 169 172 175 178] 
hist(data,3) 

或 hist(y,x)。 

例 :x 一 一 2.9:0.1:2.9 

y=randn(10000,1) 

hist(y, x) 

(3) 条 形 图 :bar(x,y)( 见 图 10 - 8)。 

例 :x= 一 2.9: 0.2:2.9 


bar(x,exp(—x.* x)) 


colormap hsv 














0 2 4 6 8 10 12 
图 10-9 误差 条 图 





(4) 误差 条 图 errorbar( 见 图 10 - 9), 格 式 如 下 : 
errorbar(Y,E) 
errorbar( X,Y ,E) 
errorbar(X,Y,L,U) 
式 中 :Y, X 为 一 组 实验 数据 ,E 则 为 误差 值 。 若 误差 上 下 不 均 ,U, L 为 上 下 值 。 
(5) 其 他 : 





三 维 图 :plot3(x,y,z); bar3; pie3。 
正 态 检验 的 正 态 概率 图 :normplot。 
登 加 正 态 密度 直方 图 :histfit 。 

画 标准 偏差 图 :schart。 
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画 水 平 条 图 :xbarplot。 
用 法 详 见 MATLAB Help。 


本 章 学 习 要 点 : 

(1) 掌握 正 态 分 布 的 特点 。 

(2) 了 解数 学 期 望 和 方差 的 计算 。 

(3) 利用 MATLAB 进行 常用 概率 分 布 的 参数 估计 和 假设 检验 。 
(4) 利用 MATLAB 作 常 用 的 统计 图 。 
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第 十 一 章 ”生命 科学 实验 数据 的 误差 分 析 


第 一 节 ”实验 数据 的 测量 误差 


测量 误差 的 产生 和 分 类 


1. 随机 误差 和 系统 误差 

实验 数据 的 测量 分 为 直接 测量 和 间接 测量 。 直 接 测 量 是 用 测量 仪器 直接 测定 
实验 量 的 值 ,如 对 温度 ,压力 时间 ,长 度 ,质量 的 测量 等 等 。 间 接 测量 是 通过 一 个 
或 多 个 直接 测量 值 ,利用 一 定 的 函数 关系 换算 得 到 实验 数据 ,如 溶液 的 组 成 和 浓度 
等 。 生 命 科 学 实验 数据 中 的 大 多 数 测量 值 都 是 间接 得 到 的 ,但 不 管 其 测量 过 程 是 
什么 过 程 ,总 是 存在 着 这 样 或 那样 的 误差 。 测 量 误差 按 其 变化 规律 ,可 以 分 为 随机 

随机 误差 和 系统 误差 是 两 种 不 同性 质 的 测量 误差 。 对 于 同一 实验 量 的 n 次 测 
最 结 果 , 如 果 误 差 的 数值 是 按 统计 的 规律 进行 变化 的 ,这 个 误差 即 是 随机 误差 。 

如 果 误 差 的 数值 是 固定 的 或 按 一 定 规律 变化 的 (该 规律 不 是 统计 规律 ), 这 个 
误差 即 是 系统 误差 。 按 系统 误差 的 来 源 可 以 分 为 四 种 类 型 :仪器 误差 ,如 仪器 使 
用 精度 下 降 , 未 予 校正 等 ;@ 操 作 误 差 , 如 人 为 读数 偏差 ,取样 代表 性 不 好 等 ;@ 方 
法 误差 ,如 实验 方法 不 完善 ,计算 公式 和 实际 有 偏差 等 ;@ 环 境 误差 ,如 环境 温度 变 
化 引起 仪器 精度 变化 ,测试 环境 污染 影响 空白 试验 等 。 

过 失误 差 是 一 种 与 事实 不 符 的 误差 ,主要 是 因为 测量 人 员 的 责任 心 不 强 .粗心 
大 意 或 测量 方法 不 正确 .仪器 操作 不 正确 所 造成 。 过 失误 差 只 要 小 心 操作 ,一 般 都 
能 避免 。 

在 测量 过 程 中 ,一 般 随 机 误差 和 系统 误差 同时 存在 ,具体 处 理 时 可 对 数据 结果 
的 影响 分 以 下 三 种 情况 区 别 对 待 : 

(1) 系统 误差 的 影响 远大 于 随机 误差 的 影响 ,这 时 可 以 忽略 随机 误差 对 数据 
的 影响 。 

(2) 随机 误差 的 影响 远大 于 系统 误差 的 影响 ,这 时 可 以 忽略 系统 误差 对 数据 
的 影响 。 
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(3) 随机 误差 的 影响 和 系统 误差 的 影响 相差 不 大 ,两 者 均 不 能 忽略 ,必须 对 两 
种 误差 分 别 进行 处 理 。 

2. 测量 误差 的 表示 

测量 误差 的 表示 形式 和 计算 误差 类 似 ,可 用 绝对 误差 和 相对 误差 来 表示 : 


绝对 误差 一 实测 值 一 真 值 
相对 误差 一 绝对 误差 / 真 值 评 绝对 误差 /实测 值 
相对 误差 经 常 以 百分比 形式 表示 , 即 
相对 误差 一 (绝对 误差 / 真 值 ) X100% 
但 是 在 实际 过 程 中 ,人 们 不 可 能 知道 真 值 ,虽然 真 值 是 客观 存在 的 ,所 以 测量 
结果 的 好 坏 常 用 偏差 大 小 来 表示 : 
偏差 一 实测 值 一 数据 平均 值 
相对 偏差 二 (偏差 /平均 值 )X100% 














实测 值 = 数据 平均 值 土 偏差 , 即 一 工 士 $ 

测量 数据 的 准确 度 和 精密 度 可 以 说 明 绝对 误差 和 相对 误差 的 大 小 ,实验 数据 
的 准确 度 好 ,表示 数据 的 绝对 误差 小 ;实验 数据 的 精密 度 好 ,表示 数据 对 均值 的 相 
对 误差 小 。 

精密 度 还 表示 在 多 次 重复 测量 中 所 测 数 据 的 重复 程度 或 分 散 程度 ,随机 误差 
小 , 即 为 重复 性 好 。 

准确 度 还 表示 测量 结果 与 被 测量 的 真 值 之 间 的 偏离 程度 , 系统 误差 小 ,准确 
度 高 。 

精密 度 与 准确 度 之 间 存在 一 定 的 关系 ,但 是 两 者 不 是 一 定 统一 的 。 精 确 度 才 
是 测量 结果 的 精密 度 和 准确 度 的 综合 反应 。 只 有 准确 度 和 精密 度 都 高 时 ,数据 的 
精确 度 才 一 定 高 。 





第 二 节 随机 误差 


因为 随机 误差 的 数值 是 按 统计 的 规律 进行 变化 ,经 过 多 次 测量 后 ,其 误差 变化 
符合 统计 的 规律 。 大 多 数 的 测量 随机 误差 具有 正 态 分 布 的 规律 。 如 图 11 - 1 所 
示 , 以 误差 频率 密度 为 纵 坐标 ,以 测量 随机 误差 为 横 坐 标 ,其 曲线 接近 于 正 态 分 布 
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概率 密度 函数 。 
/(4) 





- 


4 ol a 
图 11-1 随机 误差 的 频次 直方 图 与 其 光滑 曲线 


车 实验 数据 只 存在 随机 误差 ,实测 值 z 与 真 值 / 的 偏差 , 即 为 随机 误差 6, 个 
实测 值 x; 的 随机 误差 的 分 布 密度 函数 : 


1 
aV2Zr 


随机 误差 的 分 布 和 正 态 分 布 一 样 具有 以 下 的 特性 :误差 的 对 称 性 ,误差 的 有 界 
性 .误差 的 单 峰 性 ,误差 的 抵偿 性 。 这 也 就 是 随机 误差 所 遵循 的 统计 规律 。 

1. 随机 误差 的 统计 规律 

对 一 固定 值 进行 多 次 重复 测量 ,由 测 得 值 反映 出 随机 误差 的 变化 ,经 过 大 量 实 
验 数据 的 检验 ,随机 误差 具有 以 下 四 项 特征 ， 

(1) 对 称 性 ,绝对 值 相等 的 正 、 负 误差 出 现 的 概率 相同 , 即 当 测量 次 数 n 相当 
大 时 ,绝对 值 相等 符号 相反 的 随机 误差 出 现 的 机 会 相同 。 

(2) 有 界 性 ,绝对 值 很 大 的 误差 出 现 的 概率 为 零 , 即 在 一 定 的 条 件 下 ,随机 误 
差 的 绝对 值 不 会 超过 某 一 界限 。 

(3) 单 峰 性 ,绝对 值 小 的 误差 出 现 的 概率 大 于 绝对 值 大 的 误差 出 现 的 概率 , 绝 
对 值 小 的 误差 较 绝对 值 大 的 误差 出 现 的 次 数 多 。 

(4) 抵偿 性 , 随 着 测量 次 数 ”的 增加 ,各 个 随机 误差 的 代数 和 趋 于 零 。 

2. 随机 误差 的 正 态 分 布 特性 

正 态 分 布 规律 是 研究 随机 误差 的 理论 基础 ,其 实用 价值 可 用 以 下 四 个 理由 来 
说 明 : 

(1) 通过 实践 的 检验 ,大 量 测量 数据 的 随机 误差 都 服从 正 态 分 布 。 

(2) 对 于 服从 任何 分 布 的 独立 的 随机 变量 , 当 其 数量 足够 多 的 时 候 ,这 些 随 机 
变量 之 和 近似 地 服从 正 态 分 布 ,随机 变量 越 多 则 越 近似 地 服从 正 态 分 布 。 也 就 是 
说 ,对 于 由 许多 难以 察觉 的 影响 因素 而 产生 的 随机 误差 ,可 以 用 正 态 分 布 规律 来 研 
究 和 分 析 。 





p(€) = exp[— é&£°/(20°)] 


(3) 正 态 分 布 是 研究 其 他 分 布 的 基础 ,在 有 些 精度 要 求 不 太 高 的 情况 下 ,尽管 
严格 讲 不 适用 于 正 态 分 布 规律 的 随机 误差 ,但 仍 可 近似 的 用 正 态 分 布 来 处 理 。 如 
分 布 在 一 定 要 求 下 可 用 正 态 分 布 来 处 理 。 

(4) 对 于 有 些 测量 ,尤其 是 在 测量 次 数 很 少时 ,测量 误差 究竟 服从 什么 规律 尚 
不 清楚 ,描述 其 统计 规律 的 数学 表达 式 更 难以 找到 ,在 这 种 情况 下 常 可 用 正 态 分 布 
来 代替 测量 随机 误差 的 分 布 。 当 这 种 代替 不 能 满足 实际 要 求 , 或 需要 估计 这 种 代 
蔡 的 可 靠 程度 时 ,只 有 进一步 进行 实验 工作 ,用 统计 检验 的 办 法 来 判断 实际 分 布 与 
正 态 分 布 的 差异 。 








第 三 节 ”随机 误差 的 传递 


在 具体 导出 间接 测量 的 实验 数据 时 ,其 误差 随 其 影响 参数 的 误差 变化 而 变化 。 
根据 其 影响 关系 ,具体 可 分 为 线性 函数 的 误差 传递 和 非 线 性 函数 的 误差 传递 。 

在 科学 研究 和 工程 上 ,大 部 分 实验 测量 值 是 通过 间接 测量 确定 的 ,间接 测量 的 
误差 传递 就 是 根据 直接 测量 值 的 精度 ,来 确定 间接 测量 值 的 精度 。 研 究 误差 传递 
有 两 方面 的 问题 ,一 是 由 直接 测量 误差 来 估计 函数 或 间接 测量 值 的 误差 ,在 数据 处 
理 中 属于 分 析 间 接 测 量 误差 的 传递 问题 ;二 是 已 知 函 数 关 系 及 预先 约定 函数 关系 ， 
根据 间接 测量 值 的 误差 要 求 , 确 定 直接 测量 参数 的 容许 误差 或 容许 测量 精度 的 要 
求 , 在 数据 处 理 中 属于 分 析 直 接 测量 误差 的 分 配 问题 ,也 就 是 如 何 合理 设计 检测 系 
统 、 选 择 测试 设备 和 测量 方法 的 最 佳 实验 设计 问题 。 


一 、 随 机 误差 的 传递 计算 
因为 间接 测量 误差 y 是 通过 直接 测量 参数 确定 的 ,假设 它们 的 函数 一 般 关 系 
式 为 
y= f(x, Ze, Xn) 


将 该 函数 式 进行 泰勒 级 数 展开 , 即 可 得 到 误差 传递 的 一 般 计算 式 。 
假设 > 一 /zi，z，…，zn) 式 中 ,如 果 各 个 因素 zx; 的 误差 为 6 , 则 引出 y 的 
误差 ,公式 为 
y+ = fai nO: Tn 二 6 ) 
由 于 该 函数 式 为 非 线性 函数 ,而 各 个 误差 值 都 非常 小 ,因此 将 该 函数 式 进行 泰 
勒 级 数 展开 ,可 以 近似 地 只 取 一 阶 导数 值 ,而 忽略 其 他 高 阶 无 穷 小 ,可 得 
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?十 0, = Fr Trs es Tm) a8, + 78, + .+ Le, 














ar; Be 
即 0. — Bo + EL + tL. 
1 m 
Of Nee (Of. Y pof sy 
SS (3 2 ) + (Be 5 ) 2 ee 
2[2L aL ,0 + 六 + +… 二 六 BL L060s + J 二 


对 于 ”组 实验 点 ,会 产生 ?个 > 的 误差 ,将 ”组 y 的 误差 进行 累加 , 即 得 
忆 = 5 (23,) + (20,) t+ D (BL ) + 


由 于 随机 误差 具有 抵偿 性 , 当 n 很 大 时 ,上 式 交叉 项 求 和 应 趋 于 0。 故 上 式 
可 为 


= ee a ) 














ar 
根据 标准 误差 的 定义 : 
= 1/n2)6, 
二 (9A， 
23=[( 让 ) D6)+ + (好 /A) D8) + -+( 阐 £) > 2]/n 
2 2 2 
(BL) 4+ ) tt) 
如 果 知 道 各 个 测量 参数 的 不 确定 程度 ,或 直接 测量 值 的 误差 ,就 可 以 估计 导出 
参数 的 误差 值 。 
间接 测量 的 绝对 误差 传递 规律 为 
2 2 2 
了 一 二 (让 ) + 力 ( 澡 ) +…+( 讲 ) 
其 相对 误差 的 表示 形式 为 
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二 、 间 接 测量 的 误差 传递 公式 的 应 用 


为 方便 间接 测量 的 误差 计算 ,可 以 将 间接 测量 的 误差 传递 规律 具体 推广 到 各 
个 算法 ,如 最 常用 的 加 减法 .乘法 和 除法 等 。 

1. 加 减 运算 

如 > 是 直接 测量 参数 的 和 差 函 数 


y= 二 z 土 Xz: 土 … 土 I 
根据 误差 传递 公式 ,可 得 


os 2 (总 ) +a (总 ) + + 人 


一 鸭 十 力 十 … 十 下 
标准 误差 的 绝对 形式 为 











2. 乘法 运算 
如 果 y 是 直接 测量 参数 的 乘积 函数 : 


y= krizr 
根据 误差 传递 公式 ,可 得 


2- 区) + 区) 


标准 误差 的 绝对 形式 为 
相对 误差 则 为 
Pp =p +p 
3, 除法 运算 


如 果 > 是 直接 测量 参数 的 商 函 数 : 


二 7 一 


y = kri/z 
根据 误差 传递 公式 ,可 得 
_ 2 (Sa (oy 
马 = 臣 (六) + 乓 (这 ) 
0 = 08 (hk/z2)? +os, (— kri/z2)?’ 


= (k/z2)’[o2 十 (zi/z)a2] 


标准 误差 的 绝对 形式 为 
oy = hk/zs VE Ho ri/ za) 
相对 误差 则 为 
pF =p + 
4. 对 数 运 算 
设 函 数 ， 
y 一 4 十 blnz 


根据 误差 传递 公式 ,可 得 


标准 误差 的 绝对 形式 为 
av 一 b/z。ar 


还 可 以 将 该 误差 传递 公式 推广 到 其 他 各 种 函数 ,如 指数 函数 、 寡 函数 等 。 
[ 例 11-1] 采用 精密 库仑 法 测定 碘 酸 钾 标 准 溶液 的 浓度 ( 田 宝 珍 . 东海 海洋 


=_EM 
[J],1999,15(1))。 已 知 公式 P 一 RE。 


式 中 :P 为 KIO; 标准 溶液 浓度 ,mmol/g;E 为 标准 电池 电动 势 ,V;R 为 标准 电阻 
值 ,Q;m 为 样品 溶液 中 所 含 KIO; 的 克 数 ,g;M 为 KIO; 的 相对 分 子 质量 ;n 为 参加 
反应 的 电子 数 ;t 为 库仑 滴定 中 总 的 电解 时 间 ,s;F 为 法 拉 第 常数 ,A。s/mol。 

根据 误差 传递 公式 ,P 的 相对 误差 可 用 下 式 计算 : 

p02 = (AE/E)’? + (AR/R)’ + (AF/F)? 十 (AD2 + (Am/m)’ + (AM/M)? 


经 测定 ,标准 电池 电动 势 的 不 确定 度 AE/E 为 3X10“; 标 准 电 阻 值 的 不 确定 
度 AR/R 多 数 为 5X10“; 法 拉 第 常数 的 不 确定 度 AF/ 下 为 3X10™ ;时间 的 不 确 





3” 


定 度 At/ 为 1X10-?; KIO， 样品 质量 的 不 确定 度 Am/m 为 1X10“，; KIO: 相对 
分 子 质 量 的 不 确定 度 AM/M 都 为 3X10 ,以 单个 电子 数 代 和 人 上 式 , 即 得 到 其 相对 
误差 约 为 0.04%。 


三 、 随 机 误差 的 分 配 


在 任何 实验 数据 的 直接 定量 测定 中 ,测量 误差 是 不 可 避免 的 ,应 该 通过 合理 的 
设计 ,将 其 测量 误差 限制 在 容许 的 范围 内 。 

对 于 间接 测量 数据 ,其 误差 来 自 各 个 影响 因子 的 直接 测量 误差 的 传递 , 即 直接 
测量 的 参数 误差 通过 其 函数 关系 式 传递 给 间接 测定 参数 。 反 之 ,如 果 已 知 函 数 关 
系 式 和 间接 测定 参数 的 实验 误差 ,从 而 确定 各 个 直接 测量 参数 容许 的 误差 大 小 ,这 
就 是 误差 的 分 配 问题 。 误 差分 配 一 般 有 等 效 分 配 法 和 最 佳 分 配 法 。 

1. 等 效 分 配 法 

等 效 分 配 法 是 假定 各 个 直接 测量 参数 传递 于 间接 测定 量 的 误差 均 相 等 ,间接 
测定 量 的 误差 平均 来 自 各 个 直接 测量 参数 的 误差 , 即 








和 可 
=/ (EE) 1 ( 束 ) < 下 (BE) 
-on 人 人) = vn(a) 


o. 


0o, Pt 二 和 
Ga 


从 而 根据 总 体 误差 的 要 求 , 误 差 传递 函数 式 的 关系 ,控制 各 个 直接 测量 参数 的 测量 
误差 。 

[ 例 11-2] 为 配制 1000 mL、 浓 度 为 1.0 mg/mL 的 某 标准 溶液 ,要 求 标准 
溶液 的 浓度 误差 小 于 0. 1%, 问 称 量 时 所 容许 的 最 大 误差 是 多 少 ? 

根据 题 意 ,浓度 计算 公式 为 


C=W/V 
得 误差 公式 ， 尼 = 忆 十 克 
因 pc 二 0.1%, 按 相对 误差 等 效 分 配 : 

Pwo 


py < V0.1%)372 = 0.07% 
ow < 0.07% x 1000X1.0= 0.7(mg) 
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可 选取 相应 的 分 析 天 平 称 量 ,以 满足 误差 要 求 。 

2. 最 佳 分 配 法 

最 佳 分 配 法 是 以 间接 测量 参数 最 佳 精度 为 前 提 , 求 各 个 直接 测量 参数 所 允许 
的 误差 。 即 求 间 接 测量 参数 的 绝对 误差 或 相对 误差 为 最 小 时 的 cu ， ox, ，…， 0 。 

如 目标 函数 相对 误差 为 

2 172 
0 =m/3= [Ss) (EE)e] 

对 目标 函数 关于 各 个 测量 值 的 误差 求 偏 导 ,并 令 其 为 0, 分析 其 二 阶 导数 有 无 
极 小 值 , 求 其 误差 函数 极 值 , 求 联 立方 程 组 , 即 可 以 求 得 各 个 测量 值 的 相对 误差 
pa ,os，…， pr 。 但 是 在 求解 过 程 中 ,该 联 立 方程 组 可 能 有 多 个 解 ,也 可 能 没有 合 
适 的 解 ,经 常 需要 增加 其 他 一 些 附加 条 件 。 

3. 误差 传递 的 应 用 

实验 的 误差 分 析 在 科学 研究 中 是 非常 重要 的 ,通过 误差 大 小 分 析 和 误差 来 源 
分 析 ,确定 主 要 实验 误差 的 来 源 , 往 往 可 以 成 倍 地 提高 实验 的 准确 度 。 还 可 综合 实 
验 条 件 并 评定 所 得 的 实验 数据 的 误差 大 小 。 所 以 误差 理论 及 其 分 析 是 科学 研究 中 
常用 的 工具 之 一 。 

如 生物 反应 中 氧 传递 系数 的 测定 时 , 气 液 两 相 流量 的 测定 ` 气 液 两 相 浓 度 和 温 
度 的 测定 ,以 及 各 个 定性 参数 的 测定 都 可 能 是 实验 误差 的 来 源 。 可 以 通过 分 析 哪 
一 个 因子 是 主要 影响 因素 ,提高 主要 误差 产生 因子 的 测量 精度 ,来 提高 最 后 的 实验 
值 的 准确 度 。 

又 如 根据 溶液 的 冰点 降低 测定 相对 分 子 质量 的 公式 为 

M= Kw/(DW) 


式 中 :M 为 相对 分 子 质量 ,K 为 系数 ,w 为 测定 溶质 的 质量 ,D 为 冰点 降低 度数 ,W 
为 溶剂 的 质量 。 其 误差 传递 公式 为 


oS 
中 -2 委 + 吕 十 天 
根据 相对 分 子 质量 的 测定 要 求 ,可 以 分 别 确定 质量 和 温度 的 测定 要 求 , 并 确定 
测量 仪器 的 精度 ,完成 实验 目的 。 
误差 传递 的 应 用 主要 在 于 : 
1) 测量 方程 优选 问题 
由 于 实验 测量 结果 与 多 个 单项 测量 因素 有 关 , 有 不 同 的 表达 函数 式 ,应 该 使 所 
选择 的 测量 方程 .所 选择 的 测量 因素 、 所 选择 的 测量 方案 等 确保 测量 结果 的 总 误差 


~ 


最 小 。 特 别 对 于 生命 科学 中 的 众多 经 验方 程 的 选择 ,尤其 是 如 此 。 

对 于 测量 函数 表达 式 ,其 系统 误差 一 般 可 用 系统 误差 修正 法 进行 消除 。 因 此 ， 
研究 最 佳 测量 条 件 就 是 使 函数 的 随机 误差 减 小 到 最 小 值 。 

根据 函数 式 : 


y= f(r rpm， rn) 


得 到 该 函数 的 误差 传递 公式 为 


二) 十 (起 ) 本 + 人) 





式 中 被 测 单项 误差 的 项 数 越 少 ,函数 误差 一 般 也 就 越 小 , 即 可 以 通过 减 小 单项 测量 
因素 来 达到 减 小 总 函数 误差 的 目的 。 在 实际 过 程 中 ,如 果 同时 有 几 个 不 同 的 函数 
式 来 表达 , 则 应 选取 包含 单项 测量 因素 较 少 的 函数 表达 式 。 如 果 函 数 表达 式 的 单 
项 测量 因素 基本 相同 , 则 应 选取 误差 较 小 的 测量 值 的 函数 表达 式 。 

2) 测量 方案 的 优化 

由 间接 测量 函数 误差 的 标准 差 公 式 可 以 看 出 ,如 果 式 中 各 个 单项 误差 传递 系 
数 为 最 小 时 ,函数 误差 就 可 以 相应 变 小 ,此 时 可 以 减 小 该 单项 误差 对 函数 误差 的 影 
响 。 在 实际 过 程 中 ,根据 这 个 原则 可 以 进行 最 佳 测量 误差 的 方案 的 设计 。 

3) 测量 精度 的 提高 

许多 实验 值 在 直接 测量 时 误差 较 大 ,但 是 如 果 采 用 间接 测量 ,只 要 考虑 到 误差 
传递 系数 ,并 适当 地 进行 误差 分 配 ,就 可 以 得 到 直接 测量 无 法 达到 的 测量 精度 。 


第 四 节 ”实验 数据 的 预 处 理 


在 实际 的 测量 过 程 中 ,由 于 各 方面 的 原因 ,实验 数据 会 造成 各 种 各 样 的 误差 ， 
如 测量 者 读数 错位 ,或 记录 错误 ,或 由 于 仪器 的 突然 波动 .客观 条 件 的 突然 变化 等 ， 
都 会 造成 实验 数据 的 异常 。 如 果 在 实验 数据 的 处 理 中 ,将 混入 的 异常 数据 和 正常 
数据 一 起 处 理 ,必然 会 焉 曲 测量 结果 ,看 曲 过 程 的 事实 ,得 出 和 实际 过 程 不 相符 的 
结论 。 因 此 ,从 原始 的 实验 数据 中 剔除 异常 数据 是 非常 必要 的 。 

在 生化 控制 过 程 和 生化 参数 自动 检测 中 ,为 了 及 时 排除 外 界 对 过 程 的 随机 干 
扰 , 在 对 过 程 的 参数 进行 在 线 估计 时 ,经 常 采用 滤波 的 方法 对 被 测 参数 进行 处 理 。 

有 时 一 组 正常 的 实验 数据 也 可 能 会 有 较 大 的 分 散 性 ,这 也 是 对 过 程 的 客观 实 
际 情况 的 反映 ,如 果 人 为 地 把 某 些 表面 上 误差 较 大 的 数据 作为 异常 数据 进行 剔除 ， 
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那么 同样 会 得 到 不 正确 的 实验 结果 。 所 以 对 于 异常 数据 的 分 析 处 理 ,必然 要 有 一 
定 的 判断 准则 ,而 不 是 主观 地 做 出 取舍 。 该 判断 方法 即 是 采用 统计 学 原理 ,给 定 适 
当 的 置信 概率 , 求 出 其 相应 的 置信 区 间 , 对 各 个 数据 进行 判断 ,从 而 将 异常 数据 
剔除 。 

根据 测量 数据 的 误差 情况 ,对 可 疑 实验 观测 值 的 取舍 准则 较 多 , 下 面 介 绍 三 种 
的 鉴别 异常 数据 的 方法 。 


一 、 拉 依 特 准则 


由 正 态 分 布 的 误差 函数 特点 可 知 ,误差 特别 大 的 出 现 事件 是 小 概率 事件 。 误 
差 绝 对 值 | s | > 3c 时 的 概率 只 有 0. 002 7, 约 为 1/370。 由 于 小 概率 事件 在 一 次 偶 
然 事件 中 是 不 会 发 生 的 , 即 在 测量 次 数 较 少 的 实验 中 一 般 是 不 会 发 生 的 。 因 此 ,在 
测量 过 程 中 , 若 某 数据 的 误差 绝对 值 超过 3c 时 ,就 可 以 认为 该 数据 是 异常 数据 。 

以 公式 | 6; | > 3c 为 依据 进行 实验 数据 的 选择 ,这 个 准则 即 是 拉 依 特 准 则 。 采 
用 拉 依 特 准则 来 剔除 实验 异常 数据 是 一 种 最 为 常用 和 方便 的 方法 。 

但 是 拉 依 特 准则 的 应 用 和 所 处 理 的 实验 点 数 多 少 有 关 。 如 n 宇 10, 可 以 按 上 
式 吻 除 。 在 实验 数据 较 少 时 ,如 n 二 10, 可 以 按 | s |> 2c 进行 剔除 。 但 如 果 剔 除 
数据 过 多 ,该 处 理 方法 也 会 产生 把 异常 数据 保留 或 剔除 正确 数据 的 现象 。 

由 于 在 实际 测量 过 程 中 ,不 可 能 得 到 误差 绝对 值 ,能 得 到 的 残 差 应 该 是 s = 
zi 一, 而 且 方 差 c 也 只 能 取 试验 样本 的 标准 偏差 S。 

二 、 格 鲁 布 斯 法 

格 鲁 布 斯 (Grubbs) 法 也 是 建立 在 统计 理论 和 小 概率 事件 的 判断 上 ,通过 给 定 
剔除 数据 的 概率 ,判断 实验 数据 偏离 正 态 分 布 的 程度 ,判定 数据 取 含 的 极限 值 。 其 
处 理 步骤 如 下 : 

1. 选 定 吻 除数 据 的 概率 , 即 危 险 率 a 

危险 率 越 小 ,表示 对 剔除 数据 的 要 求 越 高 , 它 表 示 把 正常 数据 判定 为 异常 数 
据 的 出 错 概率 。 在 实际 过 程 中 ,a 的 取 值 一 般 为 0. 05，0. 025，0. 01。 它 不 宜 取得 
太 小 ,不 然 会 把 异常 数据 当 作 正 确 数据 。 

2. 计算 T 值 

对 于 一 组 所 测定 的 数据 zx ，zxs，…，z, ,剔除 其 中 的 异常 数据 ,计算 标准 偏差 


计算 值 : 
sa 











常 
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计算 工 值 : T; =| (zx; 一 z)/s | , 式 中 工 一 1/ zi。 
3. 查 取 极限 值 Te. 。 
从 格 鲁 布 斯 极限 值 ( 见 表 11 - 1) 中 查 取 给 定 危险 率 a 和 实验 点 数 时 的 极限 
值 T。.，。 
表 11- 1 格 鲁 布 斯 极限 值 Te 。 


















































自由 度 a 自由 度 
测定 次 数 测定 次 数 

0.01 | 0.025 | 0.05 0.01 | oo25 | oo5 
3 1.15 | 115 | 1.15 20 2.88 | 271 | 2.56 
4 1.49 | 1.48 | 1.46 21 2.91 | 2.73 | 2.58 
5 1.75 1.71 | 1.67 22 2.94 | 2.76 | 2.60 
6 1.94 | 189 | 1.82 23 2.96 | 2.78 | 2.62 
7 2.10 | 2.02 | 1.94 24 2.99 | 2.80 | 2.64 
8 2.22 | 2.13 | 2.03 25 3.01 | 2.82 | 2.66 
9 Za2 | 221 | Zil 30 2.91 | 2.75 
10 | 24 | 22 | 2.18 35 2.98 | 2.82 
11 2.48 | 2.36 | 2.23 40 3.04 | 2.87 
12 | 2.55 2.41 2.29 45 3.09 | 2.92 
13 2.61 | 2.46 | 2.33 50 3.13 | 2.96 
14 2.66 | 2.51 | 2.37 60 3.20 | 3.03 
15 2.71 | 2.55 | 2.41 70 3.26 | 3.09 
16 2.75 | 2.59 | 2.44 80 3.31 | 3.14 
17 2.79 | 2.62 | 2.47 90 3.35 | 3.18 
18 2.82 | 2.65 | 2.50 100 3.38 | 3.21 
19 2.85 | 2.68 | 2.53 

We ee eB SA [OCS] Lose Mom ra | RE 


4. 判断 数据 的 剔除 与 否 

将 计算 值 和 格 鲁 布 斯 极限 值 相 比较 ,如 果 T; 三 T,.,，, 则 可 认为 数据 zx; 是 异常 
数据 ,应 子 剔 除 。 根 据 统计 检验 原则 ,这 样 的 出 错 概率 为 。 反 之 ,如 果 了 <<T.，， 
则 不 可 认为 数据 x; 是 异常 数据 ,该 数据 应 予 保留 。 


三 、 狄 克 进 法 


对 于 某 个 测量 值 X 有 一 组 实验 测定 数据 zr; ，z ，…，z， 将 测定 数据 按 大 小 
进行 排列 ,如 x 过 xs 二 … 二 xz, ,在 所 有 数据 中 ,最 有 可 能 出 现 的 异常 数据 必然 出 
现在 两 端 , 即 ri 或 x,。 采 用 狄 克 逊 (Dixon) 准 则 进行 检验 时 ,应 分 别 采 用 狄 克 逊 法 
( 见 表 11 - 2) 所 示 的 统计 量 。 当 计算 的 统计 量 f。 大 于 给 定 的 相应 显著 性 水 平 a 和 
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测定 次 数 n 时 的 临界 值 f.. , , 则 判定 zi 或 z, 为 异常 实验 数据 而 将 其 剔除 。 
表 11-2 狄 克 示 统计 量 f。, ,与 fo 计算 公式 













































































PRE 
Fis 厂 计算 公式 
a 一 0.01 a= 0.05 石 可 疑 时 Zz 可 疑 时 
3 0. 988 0. 941 
4 0. 889 0.765 
5 0.780 0.642 Zn Er 
十 Ta 一 并 1 Ta 一 并 | 
6 0. 698 0. 560 
7 0.637 0. 507 
= 
8 0. 683 0. 554 
9 0. 635 0.512 -二 一 et 
由 Ta-1 一 并 1 To 一 工 2 
10 0.597 0.477 
11 0. 679 0.576 
12 0. 642 0.546 | 2 人 
Xn-1™ Xl Zn 一 2 
13 0.615 0. 521 
14 0. 641 0. 546 
15 0.616 0. 525 
16 0. 595 0. 507 
17 0. 577 0. 490 
18 0. 561 0.475 
19 0.547 0. 462 SS vs 
20 0.535 0. 450 J Wy 
21 0. 524 0. 440 
22 0. 514 0. 430 
23 0. 505 0. 421 
24 0.497 0.413 
25 0. 498 0. 406 














用 狄 克 进 法 检验 异常 数据 的 优点 是 方法 简便 ,统计 意义 容易 理解 。 但 是 如 测 
量 数据 太 少 , 容 易 把 异常 数据 判定 为 正常 数据 。 
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[ 例 11-3] 研究 灭 菌 处 理 对 碘 酸 钾 标准 物质 浓度 的 影响 ( 田 宝 珍 . 东海 海洋 
[J],1999,15(1))。 具 体 数 据 如 表 11 -3 所 示 。 





表 11-3 灭 菌 处 理 数据 








序号 灭 菌 前 测定 灭 菌 后 测定 序号 灭 菌 前 测定 灭 菌 后 测定 
VCmol/dm ) 值 /(mol/dm’) 值 /(mol/dm?) | 值 /(mol/dm’) 
1 0.009 998 1 0.009 996 6 9 0. 010 005 0. 010 000 
2 0.009 997 4 0.009 9952 10 0. 010 002 0. 010 004 
3 0.009 997 4 0. 009 995 2 11 0.010 001 0.010 004 
4 0. 010 001 0.009 9980 12 0.010 001 0.009 998 7 
5 0. 009 998 1 0. 009 997 3 13 0. 009 994 8 0. 010 002 
6 0.010 001 0. 009 9980 14 0. 009 999 5 0.010 001 
学 0. 010 003 0. 009 998 0 15 0. 009 996 8 0. 009 995 9 
8 0. 009 996 8 0.010 001 平均 值 0. 009 999 5 0. 009 999 0 


























可 得 灭 菌 前 后 碘 酸 钾 标 准 物质 浓度 的 标准 偏差 (mol/dms ) 分 别 为 土 2.8X 
10“ 和 士 2. 9X10““ ,相对 标准 偏差 分 别 为 0.03% 和 0.03%, 可 利用 本 节 所 介绍 的 
异常 数据 判断 准则 分 别 对 灭 菌 前 后 数据 进行 处 理 。 如 两 者 采用 狄 克 逊 检验 ,结果 
表明 均 无 异常 值 。 对 两 组 数据 作 方差 检验 ,得 到 下 一 1.07, 而 下 临界 值 为 2.49, 故 
下 计算 值 小 于 下 临界 值 (a = 0. 05), 结论 说 明 灭 菌 处 理 对 溶液 浓度 无 影响 。 

其 他 的 误差 处 理 方法 还 有 肖 维 勒 (Chauvenet) 准 则 .: 检验 准则 等 。 





第 五 节 系统 误差 


一 、 系 统 误 差 的 研究 特性 


根据 系统 误差 的 不 同 的 变化 规律 和 变化 特性 ， 
系统 误差 的 处 理 方法 也 有 相应 的 变化 。 系 统 误差 
的 变化 规律 有 恒定 的 ,线性 变化 的 .周期 性 变化 的 ， 
以 及 其 他 复杂 的 变化 规律 ,如 误差 单调 增加 或 单调 
减少 , 呈 三 角 函 数 或 对 数 等 周期 性 变化 ,总 的 可 以 


分 为 固定 系统 误差 和 变 值 系 统 误差 ( 见 图 11 - 2)。 


研究 系统 误差 有 其 专门 的 研究 方法 ,这 里 仅仅 
介绍 最 基本 的 原理 和 处 理 方法 。 系 统 误差 的 处 理 
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图 11-2 系统 误差 的 不 同 
变化 规律 


一 般 需 要 有 一 定 的 专业 知识 为 基础 ,因此 其 详细 的 处 理 方法 不 是 这 里 可 以 解决 的 。 
本 书 中 其 他 章节 介绍 的 实验 数据 处 理 方法 中 一 般 均 以 不 含 数据 的 系统 误差 作为 
前 提 。 

由 于 系统 误差 的 特点 ,在 实际 过 程 中 如 不 仔细 分 析 , 存 在 很 大 的 危险 性 。 因 为 
系统 误差 虽然 有 着 确定 的 规律 性 ,其 出 现 是 必然 的 ,但 其 规律 性 常常 不 易 发 现 和 认 
识 。 系 统 误差 常常 隐藏 在 测量 数据 中 ,纵然 是 多 次 重复 测量 ,也 不 可 能 降低 它 对 测 
量 精度 的 影响 。 系 统 误差 的 数值 经 常 比 随机 误差 的 数值 要 大 , 故 其 对 数据 的 潜在 
的 影响 和 危险 性 经 常 超 过 随机 误差 。 

研究 系统 误差 在 科学 研究 中 具有 现实 意义 。 研 究 系统 误差 对 提高 数据 的 精确 
度 有 重要 意义 。 随 机 误差 的 数学 处 理 和 估计 ,是 以 测量 数据 中 不 含 系统 误差 为 前 
提 的 。 不 研究 系统 误差 的 规律 性 ,不 消除 系统 误差 对 数据 处 理 的 影响 ,随机 误差 的 
估计 就 会 丧失 精确 性 ,特别 是 当 系统 误差 的 大 小 和 随机 误差 的 大 小 相当 时 ,如 仅 分 
析 随 机 误差 ,误差 分 析 就 变 得 毫 无 意义 。 

在 某 些 测量 实践 中 ,系统 误差 的 数值 相当 大 ,甚至 比 随机 误差 还 大 得 多 。 例 如 
在 高 精度 比较 测量 中 ,由 基准 件 偏差 所 产生 的 系统 误差 相当 显著 ,必须 按 其 规律 
性 ,用 一 定 的 方法 和 判 据 ,及 时 发 现 其 系统 误差 的 存在 ,并 加 以 消除 ,这 往往 成 为 提 
高 测量 精度 的 关键 。 

但 是 把 系统 误差 研究 清楚 是 相当 艰巨 的 。 对 系统 误差 的 认识 .限制 和 消除 , 目 
前 还 没有 普遍 适用 的 方法 和 原则 。 一 般 来 说 ,系统 误差 的 研究 和 专业 知识 紧密 相 
关 。 对 于 系统 误差 的 常规 处 理 还 是 属于 测量 技术 测量 方法 上 的 问题 。 对 待 系统 
误差 ,不 可 能 像 随机 误差 那样 ,得 出 一 些 普遍 通用 的 处 理 方法 ,而 只 能 针对 每 一 具 
体 情况 ,采用 不 同 的 处 理 措施 。 处 理 是 否 得 当 , 在 很 大 程度 上 取决 于 观测 和 测量 者 
的 经 验 、 学 识 , 技 巧 和 水 平 ,以 及 对 实验 过 程 的 了 解 程度 。 虽 然 系 统 误差 是 有 规律 
的 ,但 实际 处 理 起 来 ,往往 要 比 无 规律 的 随机 误差 困难 得 多 。 

另外 ,由 于 系统 误差 的 特有 规律 性 ,研究 系统 误差 常常 可 以 得 到 新 的 发 现 , 它 
是 发 现 新 事物 的 向 导 。 对 系统 误差 的 深入 研究 ,将 对 事物 的 进一步 认识 产生 重要 
的 作 

















在 处 理 系统 误差 时 ,以 下 经 验 应 当 记 取 : 

(1) 在 测量 前 ,必须 尽 可 能 预见 到 一 切 可 能 产生 系统 误差 的 来 源 ,并 设法 消除 
它们 ,或 者 让 它们 的 影响 减弱 到 可 以 接受 的 程度 ,如 环境 因素 的 影响 ,测量 仪器 的 
影响 等 。 

(2) 在 实际 测量 过 程 中 ,可 以 采用 一 些 有 效 的 测量 方法 ,消除 或 减弱 系统 误差 
对 测量 结果 的 影响 。 

(3) 在 进行 数据 处 理 时 ,还 可 以 设法 检查 是 否 存在 着 尚未 被 注意 到 的 变 值 系 
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(4) 设法 估计 出 未 能 被 消除 而 残留 下 来 的 系统 误差 对 最 终 测量 结果 的 影响 ， 
即 设法 估计 出 残余 系统 误差 的 数值 范围 ,或 测量 的 不 确定 度 。 有 时 候 误差 的 大 小 
并 不 太 重 要 ,重要 的 是 要 了 解 其 可 能 变化 的 范围 。 


二 、 系 统 误 差 的 规律 


系统 误差 的 变化 规律 有 以 下 几 种 : 

(1) 固定 误差 。 在 测量 过 程 中 ,误差 的 符号 和 大 小 都 是 固定 不 变 的 系统 误差 ， 
称 为 固定 误差 。 

(2) 线性 误差 。 在 测量 过 程 中 ,误差 值 随 影响 因素 的 变化 作 线 性 增 大 或 减少 
的 变化 , 称 为 线性 误差 。 

(3) 周期 性 误差 。 在 测量 过 程 中 , 若 误 差 随 影响 因素 变化 是 按 周期 性 变化 的 
系统 误差 , 称 为 周期 性 误差 。 

(4) 复杂 规律 误差 。 在 测量 过 程 中 , 若 误差 随 影响 因素 变化 是 按 确定 的 且 是 
复杂 规律 变化 的 系统 误差 ,就 称 为 复杂 规律 误差 。 这 个 复杂 规律 可 能 是 各 种 规律 
的 复合 ,如 固定 误差 和 线性 误差 的 全 加 。 但 是 系统 误差 和 随机 误差 相 结 合 时 ,也 常 
常 出 现 复杂 规律 误差 。 


三 、 发 现 系统 误差 的 方法 


因为 系统 误差 的 危害 性 大 ,为 了 消除 或 减 小 系统 误差 ,其 前 提 是 必须 发 现 系 统 
误差 的 存在 。 随 机 误差 的 分 布 一 般 服 从 正 态 分 布 ,系统 误差 检验 的 理论 基础 是 实 
验 数 据 偏离 正 态 分 布 的 程度 ,将 误差 中 非 随机 变化 部 分 进行 分 离 和 判断 。 由 于 在 
实际 过 程 中 ,系统 误差 往往 要 大 于 随机 误差 ,所 以 在 估计 误差 的 时 候 ,经 常 需 要 两 
者 的 分 离 , 以 便 进 一 步 研究 系统 误差 和 随机 误差 。 

发 现 系统 误差 的 方法 有 : 

1. 实验 对 比 法 

实验 对 比 法 是 改变 产生 系统 误差 的 条 件 , 进 行 不 同 条 件 下 的 测量 ,以 发 现 系统 
误差 ,这 种 方法 适用 于 固定 系统 误差 的 发 现 。 因 为 固定 系统 误差 单 赁 一 种 测量 方 
法 或 一 种 测量 仪器 是 不 可 能 发 现 的 。 

2. 剩余 误差 观测 法 

剩余 误差 观测 法 是 根据 各 个 测量 值 的 剩余 误差 大 小 和 符号 的 变化 规律 ,直接 
由 误差 数据 或 误差 曲线 来 判断 系统 误差 的 存在 ,这 种 方法 适用 于 规律 性 系统 误差 
的 发 现 。 这 在 系统 误差 大 于 随机 误差 时 才 容易 做 出 较为 明确 的 判断 。 一 般 来 说 ， 
剩余 误差 散 点 图 比较 直观 ,如 图 11 - 3 所 示 。 
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图 11- 3 剩余 误差 散 点 图 
(a) 随机 误差 或 定 值 系 统 误差 ;b) 线性 系统 误差 ;(c) 周期 性 系统 误差 ;(d) 复杂 性 系统 误差 


3 剩余 误差 校 核 法 

把 nn 次 测量 值 的 剩余 误差 进行 校 核 计算 ,发 现 线性 规律 变化 的 系统 误差 。 
由 于 误差 经 过 计算 ,使 这 种 方法 比 上 面 的 方法 能 更 简单 .更 明显 地 发 现 问题 的 
所 在 。 

具体 是 将 一 列 测量 数据 按 测量 的 先后 次 序 进 行 排列 ,把 前 面 一 半 和 后 面 一 半 
数据 的 剩余 误差 分 别 求 和 ,然后 求 这 两 个 和 的 差 值 A, 若 差 值 A 显著 不 为 零 , 则 在 
该 组 测量 数据 中 含有 系统 误差 。 但 有 时 剩余 误差 和 的 差 值 A 为 零 , 也 仍 有 可 能 存 
在 系统 误差 ,如 周期 性 系统 误差 。 

4. 计算 数据 比较 法 

对 同一 被 测量 所 得 的 许多 实验 数据 ,可 以 通过 计算 数据 比较 ,分 析 其 实验 数据 
的 误差 类 型 ,以 发 现 是 否 存 在 系统 误差 。 可 以 将 实验 数据 以 统计 检验 的 方法 进行 
分 析 , 也 可 以 采用 一 些 较 简单 的 误差 判 据 进行 分 析 。 

如 以 统计 的 方法 分 析 实 验 数据 的 平均 值 和 方差 。 该 方法 中 最 有 名 的 例子 是 
1892 年 震 莱 (Rayleigh) 从 所 分 离 的 氮气 中 发 现 了 惰性 元 素 “ 毛 ”。 下 面 举例 说 明 。 

[ 例 11-4] 雷 莱 用 两 种 不 同 的 方法 制备 氮气 , 测 得 氮气 密度 平均 值 及 标准 
偏差 分 别 为 : 
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(1) 从 多 种 含 氮 化 合 物 中 (如 硝酸 盐 、 氨 盐 、 氧 化 物 等 ) 制 备 得 到 的 氮气 : 
A = 2.29971, o = 0.00041 


(2) 从 大 气 中 直接 分 离 得 到 的 氮气 : 
FB& = 2.31022, o = 0.00019 
对 上 述 两 种 方法 进行 统计 分 析 , 判 断 方法 之 间 是 否 存在 差异 ,由 此 得 到 


k= lam | 0.0105/0.00019 = 23»3 
VA 3 人 
， 从 两 组 结果 的 差别 说 明 两 种 方法 之 间 存 在 着 显著 的 不 同 ,远大 于 随机 误差 的 
容许 范围 ,可 以 肯定 有 系统 误差 存在 。 通 过 对 该 系统 误差 的 研究 ,惰性 元 素 “ 氨 ” 终 
于 得 以 发 现 。 


四 、 减 少 和 消除 系统 误差 的 方法 


在 测量 过 程 中 ,如 通过 检验 发 现 有 系统 误差 存在 ,就 必须 进一步 分 析 研 究 产生 
系统 误差 的 因素 以 及 减少 和 消除 系统 误差 的 方法 。 由 于 系统 误差 产生 的 多 样 性 ， 
要 找 出 普遍 有 效 的 方法 是 比较 困难 的 ,只 能 根据 实际 情况 进行 处 理 ,总 的 原则 是 在 
合理 的 处 理 下 满足 实际 提出 的 需要 。 生 命 科学 实验 中 常用 对 照 实 验 、 回 收 实验 、 空 
白 实 验 、 仪 器 校正 来 处 理 。 

下 面 仅 介绍 几 种 最 基本 的 方法 。 

1. 从 产生 误差 的 根源 上 消除 系统 误差 

从 产生 误差 的 根源 上 消除 误差 是 最 根本 的 方法 , 它 要 求 测量 人 员 对 测量 过 程 
中 可 能 产生 的 系统 误差 的 环节 作 仔细 研究 和 深入 分 析 , 找 出 可 能 产生 误差 的 原因 ， 
并 在 正式 测试 之 前 就 将 误差 从 产生 根源 上 加 以 消除 。 如 为 了 防止 零 位 变动 造成 误 
差 . 则 在 测量 开始 和 结束 时 都 要 检查 仪器 零 位 ,必要 时 重新 调整 零 位 ;又 如 ,为 了 防 
止 在 长 期 使 用 时 仪器 精度 降低 , 则 应 对 仪器 进行 周期 性 检查 。 如 果 误 差 是 由 外 界 
条 件 引起 的 , 则 应 在 外 界 条 件 比 较 稳定 时 进行 测量 。 

2. 用 修正 方法 消除 系统 误差 

这 种 方法 是 预先 将 测量 器 具 的 系统 误差 检定 出 来 或 计算 出 来 , 列 出 误差 表 或 
绘制 误差 曲线 ,然后 取 与 误差 值 大 小 相同 而 符号 相反 的 值 作为 修正 值 ,将 实际 测 得 
值 加 上 相应 的 修正 值 , 即 可 得 到 不 包含 该 系统 误差 的 测量 结果 。 只 要 测量 仪器 或 
测量 方法 对 实验 数据 有 稳定 的 重复 性 ,就 可 以 采用 这 种 方法 进行 修正 。 如 温度 . 压 
力 、 浓 度 等 的 测定 ,可 根据 其 校正 曲线 消除 系统 误差 ,避免 此 项 系统 误差 的 产生 。 

因为 修正 值 本 身 也 含有 一 定 的 误差 ,因此 这 种 方法 不 可 能 将 全 部 系统 误差 修 
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正 掉 。 

3， 消除 固定 性 系统 误差 的 方法 

1) 代替 法 (或 置换 法 ) 

代替 法 的 实质 是 在 测量 装置 上 对 所 要 测量 的 量 进行 测量 后 ,不 改变 测量 条 件 ， 
立即 用 一 个 标准 量 代替 被 测 的 量 ,并 在 测量 装置 上 重新 测量 ,从 而 求 出 被 测量 与 标 
准 量 的 差 值 , 即 :被 测量 一 标准 量 十 差 值 。 

这 种 方法 最 早 被 用 于 称 重 上 ,所 以 也 称 为 沃 尔 德 称 重 法 。 

2) 抵消 法 

抵消 法 要 求 对 同一 实验 分 别 进行 正 反方 向 的 两 次 测量 ,以 使 两 次 读数 时 出 现 
的 系统 误差 大 小 相等 而 符号 相反 。 因 此 , 取 两 次 测量 值 的 平均 值 作为 测量 结果 , 即 
可 消除 系统 误差 。 

3) 交换 法 (或 对 照 法 ) 

交换 法 是 根据 误差 产生 的 原因 ,将 某 些 条 件 交换 ,以 便 抵 消 所 引起 的 误差 并 将 
其 消除 。 

4. 消除 线性 系统 误差 的 方法 (对 称 观测 法 ) 

对 于 线性 误差 ,误差 值 随 影响 因素 的 变化 作 线 性 增 大 或 减少 的 规律 性 变化 ,可 
利用 误差 在 测定 范围 内 关于 中 点 对 称 的 特点 ,采用 实验 方法 将 其 消除 。 为 此 可 对 
称 地 进行 测量 ,以 使 其 在 测量 结果 中 相互 比较 的 是 测量 结果 的 算术 平均 值 。 

5， 消除 周期 性 系统 误差 的 方法 一 一 半 周 期 偶 次 观测 法 

对 于 周期 性 误差 ,有 效 的 消除 方法 是 每 经 过 半 个 周期 进行 偶 次 观测 , 即 在 某 个 
时 刻 测定 数据 后 ,相隔 半 个 周期 再 测 一 个 数据 ,每 个 周期 能 取得 两 次 数据 ,然后 取 
两 次 数据 的 平均 值 来 消除 周期 性 系统 误差 。 这 就 是 半 周 期 偶 次 观测 法 。 


本 章 学 习 要 点 : 

(1) 测量 误差 的 表示 。 

(2) 随机 误差 的 基本 特征 。 

(3) 随机 误差 的 传递 规律 。 

(4) 系统 误差 的 基本 特征 。 

(5) 数据 预 处 理 方法 ,如 拉 依 特 准则 等 。 
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第 十 二 章 ”生命 科学 中 的 数学 模型 建立 


第 一 节 ”实验 数据 处 理 和 数学 模型 的 建立 


一 、 实 验 数据 的 一 般 处 理 程序 


近年 来 生命 科学 和 信息 科学 发 展 迅速 ,其 他 学 科 和 生命 科学 的 结合 和 交叉 越 
来 越 多 ,数据 的 采集 日 益 简便 ,特别 是 计算 机 在 线 采集 数据 技术 迅速 发 展 , 因 此 相 
关 的 待 处 理 的 数据 多 种 多 样 ,数据 量 急剧 增加 。 在 生命 科学 中 ,虽然 各 个 参数 之 间 
的 关系 极为 复杂 ,多 为 非 线性 关系 ,但 常见 的 数据 处 理 方法 不 外 乎 三 种 , 即 图 形 表 
示 法 ,数据 列表 法 和 数学 模型 法 (或 方程 表示 法 )。 数 据 处 理 过 程 是 把 从 实际 过 程 
中 得 到 的 大 量 实验 数据 按照 一 定 程序 进行 分 析 处 理 ,从 中 找 出 参数 之 间 存 在 的 规 
律 。 如 果 是 用 数学 方程 或 数学 模型 表示 参数 之 间 的 关系 ,就 被 称 为 实验 数据 的 
建 模 。 

较为 简单 实用 的 方法 是 图 形 表示 法 、 数 据 列 表 法 。 图 形 表示 法 是 根据 实验 数 
据 在 选 定 的 坐标 系 上 表示 实验 结果 ,如 直角 坐标 、 对 数 坐标 、 半 对 数 坐 标 等 。 它 的 
优点 是 简明 直观 ,能 够 反映 数据 的 变化 趋势 和 变化 特点 ,但 是 它 不 能 很 好 地 表示 三 
个 以 上 变量 之 间 的 关系 , 且 它 的 随意 性 较 大 ,即使 是 同一 组 实验 数据 ,其 结果 也 是 
因 人 而 异 。 常 用 的 图 形 有 普通 散 点 图 、 统 计 直 方 图 、 饼 形 图 、 折 线 图 等 。 

数据 列表 法 是 根据 实验 的 内 容 和 要 求 , 进 行 数 表 的 设计 ,使 其 具有 明确 的 名 称 
和 标题 ,可 以 表示 重要 的 数据 和 实验 结果 。 其 优点 是 简单 ,数据 易于 参考 比较 , 形 
式 紧 次, 但 是 不 够 直观 ,对 数据 的 变化 趋势 不 如 图 形 表示 法 简单 明了 。 而 且 利用 列 
表 法 求 取 两 个 数据 的 中 间 值 时 常常 需要 借助 于 插值 公式 进行 计算 。 

对 于 实验 数据 的 进一步 研究 ,采用 以 上 两 者 还 不 够 ,常常 需要 通过 方程 来 表示 
实验 数据 。 数 学 模型 是 采用 数学 语言 描述 某 个 系统 特征 的 模型 , 它 可 以 定量 地 描 
述 事物 的 内 在 联系 和 变化 规律 。 数 学 模型 的 优点 是 使 用 方便 ,并 为 计算 机 的 应 用 
提供 了 基础 。 通 过 众多 实验 数据 的 分 析 , 求 出 表示 各 个 变量 之 间 关 系 的 函数 公式 
或 方程 式 ,利用 该 函数 公式 所 求 取 的 实验 结果 具有 计算 上 的 统一 性 。 数 学 模型 法 
便于 计算 实验 过 程 的 中 间 值 ,克服 了 图 形 表示 法 的 主观 的 影响 。 
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二 、 数 学 模型 的 一 般 建立 过 程 

对 一 个 生命 系统 或 生物 系统 进行 数学 描述 ,建立 数学 模型 ,首先 必须 了 解 过 程 
的 基本 变量 ,从 中 选择 合适 的 变量 作为 过 程 的 特征 变量 。 数 学 模型 的 建立 过 程 是 ， 
通过 实验 测定 过 程 的 特征 变量 ,研究 这 些 特征 变量 的 关系 ,得 到 它们 之 间 的 数学 关 
联 式 ,而 且 常 常 是 数据 处 理 和 实验 设计 同时 进行 。 

数学 模型 的 一 般 建立 程序 为 : 

选择 系统 的 特征 参数 一 测量 实验 数据 一 分 析 并 剔除 异常 数据 一 补充 漏 失 数据 
一 (正常 数据 修 匀 ) 一 选择 模型 (函数 式 ) 一 数据 拟 合 或 模型 参数 估计 一 回归 分 析 一 
得 到 数学 表达 式 或 数学 模型 一 模型 检验 一 如 果 模 型 检验 不 正确 一 重新 选择 模型 

M 


+， 如果 检验 正确 -= 模型 预测 、 模 拟 和 控制 
其 中 实验 异常 数据 的 刚 除 包括 数据 的 随机 误差 分 析 和 系统 误差 分 析 ,如 过 失误 差 、 
仪器 故障 .人 为 原因 等 造成 的 数据 异常 , 它 不 会 影响 数据 的 进一步 处 理 。 模 型 ( 函 
数 式 ) 一 般 以 图 形 表示 法 为 基础 ,根据 散 点 图 的 形状 ,对 照 标准 曲线 的 特征 进行 
选择 。 


第 二 节 ”数学 模型 的 建立 方法 


一 个 完整 的 建立 数学 模型 的 工作 步 又 应 包括 :模型 的 建立 模型 参数 的 估计 和 
模型 的 鉴别 。 


一 、 数 学 模型 的 建立 


模型 建立 的 主要 方法 是 推演 或 选择 。 模 型 的 选择 是 按 过 程 性 质 在 已 有 模型 中 
选择 一 种 或 数 种 予以 组 合 。 模 型 的 推演 是 根据 过 程 中 物理 的 、 化 学 的 ,生物 的 规律 
寻求 适当 的 数学 公式 。 

一 般 而 言 ,要 建立 一 个 数学 模型 ,首先 应 确定 模型 的 对 象 以 及 建 模 的 目的 , 通 
过 实验 测定 或 收集 可 靠 的 实验 数据 。 一 个 体系 的 数学 模型 ,一 般 指 的 是 表征 该 体 
系 的 诸 变量 参数 的 数学 关系 。 因 此 ,模型 的 建立 首先 应 对 一 个 体系 用 物理 的 语言 
加 以 描述 ,然后 再 用 数学 的 语言 表达 ,得 出 模型 函数 式 。 

这 种 描述 通常 有 两 种 方法 :一 种 方法 是 把 实际 系统 所 有 因素 全 部 不 加 取舍 都 
考虑 在 内 ,但 是 ,对 过 程 各 因素 的 关系 详尽 地 予以 描述 既 不 现实 ,也 是 不 必要 的 。 
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一 方面 因为 是 对 过 程 还 不 能 做 到 完全 了 解 , 特 别 是 生命 过 程 ; 另 一 方面 因为 目前 所 
了 解 的 数学 知识 和 计算 手段 也 有 限 . 因 此 实际 过 程 相当 复杂 。 另 一 种 方法 是 将 实 
际 系统 合理 简化 ,对 各 种 因素 取 主 舍 次 ,简化 成 能 够 进行 适当 的 描述 ,抽象 为 一 
个 数学 模型 。 只 有 通过 简化 ,才能 将 复杂 的 实际 过 程 和 有 限 的 数学 手段 调和 起 
来 。 简 化 是 一 个 重要 环节 。 通 过 对 实验 过 程 物理 实质 的 概括 和 合理 的 简化 , 首 
先 用 简明 的 物理 图 像 加 以 描绘 ,然后 可 以 用 数学 语言 表达 ,得 出 数学 方程 的 函数 
关系 , 即 模型 函数 。 所 以 ,只 有 对 生命 科学 和 生物 工程 的 过 程 机 理 本 质 有 较 深 的 
研究 .确切 的 理解 ,对 于 其 内 在 规律 性 有 较 完善 的 资料 ,才能 得 到 恰如其分 的 简 
化 图 像 。 

数学 的 特点 是 在 于 它 的 概念 的 抽象 性 ,同时 具有 严密 的 逻辑 性 和 结论 的 确定 
性 。 数 学 模型 的 特征 是 “简化 ”, 没 有 简化 就 不 能 成 其 为 模型", 但 简化 必须 合理 。 
所 建立 数学 模型 的 优 劣 也 取决 于 对 过 程 简化 的 合理 性 。 但 是 合理 性 是 相对 的 ,一 
个 过 程 有 几 种 模型 , 哪 一 种 才 最 合理 ,这 就 要 求 考 虞 以 下 几 条 原则 : 

(1) 简化 而 不 丢失 真实 性 , 即 保留 过 程 的 特征 。 

(2) 简化 而 能 满足 应 用 要 求 , 即 模型 的 实用 性 要 强 。 

(3) 简化 而 能 适应 当前 实验 条 件 ,以 便 进 行 模型 鉴别 和 参数 估计 。 

(4) 简化 而 能 适应 现 有 计算 机 能 力 。 

然后 在 上 述 原则 的 基础 上 ,全 面 地 ,综合 地 做 出 合理 的 判断 。 


二 、 模 型 参数 的 估计 


模型 是 指 描述 一 个 实际 系统 的 各 个 参数 及 变量 之 间 的 数学 关系 , 故 模型 参数 
的 估计 是 一 个 重要 的 问题 。 首 先 应 合理 地 选择 用 以 描绘 模型 的 适当 参数 , 即 过 程 
的 特征 参数 ,然后 进行 参数 估计 。 所 谓 模型 参数 的 估计 ,是 指 在 选 定 模型 函数 后 ， 
如 何 根据 实验 数据 来 求 取 该 函数 中 所 含 参 数 的 值 。 一 个 模型 可 能 包括 若干 个 模型 
参数 ,这 些 参 数 除 个 别 可 以 根据 过 程 机 理 推导 而 得 之 外 .大 部 分 通过 下 面 两 类 方法 
得 到 : 

一 类 是 用 现 阶段 的 实验 技术 独立 进行 测定 .包括 直接 测定 和 间接 测定 ,如 生化 
反应 的 反应 速度 常数 ,活化 能 ; 另 一 类 则 难以 测定 或 不 能 独立 测定 ,如 有 机 相 中 的 
酶 反应 系统 中 有 机 相 和 水 相 的 相间 交换 量 , 固 定 化 酶 的 颗粒 表面 积 等 .其 数值 一 般 
要 通过 模型 计算 的 总 结果 和 实验 结果 相 比 较 . 反 推 而 得 。 

虽然 模型 参数 值 的 选取 视 模型 的 具体 情况 不 同 , 可 采用 不 同 的 方法 .但 是 其 根 
本 原则 是 一 致 的 , 那 就 是 选取 参数 值 ,使 模型 的 计算 值 与 实验 值 尽 可 能 接近 。 为 了 
定量 地 表示 这 种 计算 值 与 实验 值 接近 的 程度 , 常 定义 某 种 目标 函数 。 目 标 函 数 一 
方面 是 模型 参数 的 函数 ; 另 一 方面 , 它 又 定量 地 表征 模型 计算 值 与 实验 值 之 差 。 因 
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此 ,参数 估计 问题 就 是 寻求 一 组 参数 使 得 目标 函数 值 最 小 。 

按照 实验 的 目的 和 要 求 ,有 时 可 以 选择 不 同 的 目标 函数 进行 模型 的 参数 估计 。 
按 不 同 目标 函数 估计 得 到 的 模型 参数 值 也 会 有 区 别 , 但 不 妨碍 模型 在 不 同情 况 下 
的 应 用 。 


三 、 模 型 的 鉴别 


按 实验 过 程 的 机 理 分 析 , 有 时 对 同一 过 程 可 以 获得 两 个 或 两 个 以 上 的 模型 , 表 
现 为 若干 个 可 能 模型 之 间 的 “竞争 ”, 因 而 存在 一 个 如 何 鉴别 这 些 模 型 ,对 这 些 模 型 
进行 筛选 ,最 后 确定 一 个 适宜 的 模型 的 问题 。 

模型 的 筛选 与 鉴别 并 无 严格 的 区 分 。 一 般 来 说 ,如 果 是 从 众多 的 模型 中 用 一 
些 简便 的 ,甚至 原始 的 但 都 是 行 之 有 效 的 方法 ,淘汰 一 些 明显 不 合适 的 模型 , 选 出 
一 个 或 少数 几 个 最 合理 .最 有 效 的 模型 ,那么 这 一 评选 的 过 程 常 成 为 模型 的 筛选 。 
至 于 模型 的 鉴别 , 则 经 常 是 指 考察 给 定 模型 的 本 身 是 否 合理 ,以 及 它 是 否 能 有 效 地 
模拟 所 研究 的 体系 。 对 机 理 模型 ,是 鉴别 哪 一 种 机 理 能 更 有 效 地 反映 该 过 程 的 真 
实情 况 。 而 对 经 验 模型 , 则 是 鉴别 哪 一 种 经 验方 程式 足够 可 靠 ,不致 与 实验 数据 偏 
离 过 大 。 总 之 ,筛选 主要 是 比较 几 个 模型 的 优 劣 ,而 鉴别 则 主要 是 考察 指定 的 模型 
与 实际 体系 是 否 贴切 。 

模型 的 筛选 与 鉴别 并 无 一 个 机 械 的 步骤 可 以 遵循 ,常常 需要 与 参数 估计 结合 
起 来 进行 。 在 模型 的 筛选 和 参数 估计 中 有 时 会 发 现 模型 的 误差 太 大 ,以 致 对 于 不 
同 模型 的 取舍 把 握 不 大 。 对 于 机 理 模型 ,误差 太 大 可 能 是 由 于 实验 数据 准确 性 太 
差 造成 ;模型 的 取 含 困难 或 者 是 由 于 实验 的 数据 不 足 , 这 时 就 应 通过 “实验 设计 "来 
进行 补充 ,或 者 对 下 步 实 验 安排 提出 合理 的 建议 和 要 求 。 只 有 实验 方法 准确 ,整理 
数据 的 方法 科学 ,试验 设计 合理 ,才能 很 好 地 进行 模型 的 筛选 和 鉴别 。 

模型 鉴别 的 方法 很 多 ,方差 分 析 、 残 差分 析 以 及 经 典 的 最 小 二 乘法 都 可 以 用 来 
有 效 地 进行 鉴别 。 近 代 的 回归 系统 分 析 方 法 和 信息 论 用 于 模型 鉴别 和 参数 的 估计 
已 具有 重要 的 意义 。 

模型 来 源 于 实践 ,而 又 高 于 实践 ; 反 过 来 , 它 又 不 断 接受 实践 的 检验 。 检 验 的 
主要 对 象 是 :简化 假定 的 合理 性 ,数学 表达 式 是 否 准确 无 误 ,参数 估计 是 否 可 靠 , 参 
数 是 否 发 生变 化 ,以 及 环境 对 系统 的 影响 等 。 模 型 检验 的 结果 如 果 不 正确 , 则 须 对 
模型 的 假设 作出 修改 ,补充 假设 ,重新 建 模 , 直 到 结果 满意 为 止 。 

数学 模型 就 是 在 实践 的 检验 中 不 断 演进 完善 和 发 展 的 。 经 修正 的 实验 模型 则 
可 以 用 来 指导 实验 操作 、 生 产 操 作 以 及 用 于 实验 过 程 和 生产 过 程 的 电子 计算 机 
控制 。 
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第 三 节 ”数学 模型 的 选择 


一 、 数 学 模型 的 类 型 


根据 实验 中 各 个 参数 之 间 的 数学 表达 关系 式 的 形式 ,可 分 为 不 同 函数 的 模型 ， 
如 线性 模型 和 非 线 性 模型 。 而 根据 自 变量 的 数目 ,又 可 分 为 一 元 模型 和 多 元 模型 
两 种 形式 。 生 命 科学 和 生物 工程 中 的 模型 大 多 为 多 元 非 线 性 的 模型 。 

生命 科学 和 生物 工程 中 开发 的 数学 模型 通常 有 其 目的 ,根据 其 目的 的 不 同 , 从 
而 可 以 得 到 不 同 作 用 和 功能 的 数学 模型 。 

(1) 预测 模型 。 根 据 整个 过 程 前 期 数据 来 预测 过 程 进行 的 后 期 情况 , 若 过 程 
发 生 偏离 ,就 能 及 时 发 现 问题 ,并 采取 一 定 的 措施 ,加 以 改进 和 校正 ,使 其 顺利 进 
行 。 如 人口 预测 ,传染 病 预 测 . 生 产 工 艺 预测 等 。 

(2) 分 析 模型 。 主 要 供 过 程 分 析 使 用 ,可 用 于 分 析 过 程 特征 ,反映 各 个 变量 之 
间 的 关系 。 如 微生物 反应 工程 模型 , 药 效 动力 学 模型 等 。 

(3) 间接 测量 模型 。 由 于 过 程 的 具体 情况 ,有 一 些 参 数 无 法 直接 获得 ,通过 数 
学 模型 间接 获得 参数 ,然后 供 过 程 研究 、 分 析 使 用 。 如 细胞 沉降 速度 模型 等 。 

(4) 控制 模型 。 用 于 对 整个 过 程 (如 反应 过 程 .分 离 过程 等 ) 的 控制 ,可 以 通过 
计算 机 实现 控制 ,提高 劳动 生产 率 ,降低 劳动 强度 。 数 学 模型 的 成 功 建立 是 能 否 实 
现 计算 机 控制 ,并 产生 经 济 效益 的 关键 之 一 。 

一 般 数学 模型 根据 其 实验 背景 ,可 分 为 机 理 模型 . 半 机 理 模型 和 经 验 模型 。 

机 理 模型 是 建立 在 过 程 的 机 理 基础 上 的 模型 ,如 表示 酶 反应 动力 学 的 米 氏 方程 ; 
r 三 rmxS/(Ks 十 S), 催化 反应 动力 学 中 的 阿 累 尼 乌 史 定律 :k= hoexp[ 一 AE/ (RT)]。 
它 是 从 分 析 生 物化 学 和 生物 工程 中 现象 或 过 程 的 物理 和 化 学 本 质 的 机 理 出 发 , 利 
用 生命 科学 和 生物 工程 的 基本 理论 建立 的 系统 的 数学 描述 方程 式 ,这 种 数学 方程 
式 往往 相当 复杂 ,但 具有 明确 的 物理 意义 。 这 种 模型 的 优点 是 科学 性 严明 ,充分 利 
用 基础 理论 研究 的 成 果 来 探索 新 的 过 程 ,分 析 其 因果 关系 ,而 不 必要 先 有 真实 过 程 
装置 ,对 于 从 理论 上 指导 科学 实验 和 实际 生产 有 重大 意义 。 缺 点 是 必须 对 过 程 机 
理 有 较 深 入 的 分 析 , 要 求 比 较 全 面 的 基础 数据 ,而 这 些 往往 是 实际 过 程 中 所 缺乏 
的 ;而 且 由 于 实际 过 程 的 影响 因素 太 多 ,几何 结构 形状 复杂 ,往往 必须 做 各 种 简化 ， 
这 也 影响 最 后 结果 的 准确 性 。 

纯 经 验 的 模型 是 以 过 程 的 实测 的 实验 数据 为 基础 ,而 不 管 过 程 的 本 质 ,或 者 内 
部 机 理 无 法 直接 了 解 ,直接 对 实验 数据 进行 数理 统计 分 析 , 得 到 各 个 参数 之 间 的 函 
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数 关系 。 如 紫外 线 照 射 菌 体 悬 浮 液 ,照射 时 间 与 菌 体 的 存活 率 之 间 的 关系 为 一 
dMVd = &N, 仅 从 实验 数据 出 发 进行 隐 数 式 的 推断 ,得 到 菌 数 和 灭 菌 时 间 的 定量 
关系 。 研 究 这 种 纯 经 验 的 模型 时 .将 系统 作为 “黑箱 ”进行 处 理 , 仅 考虑 进出 系统 的 
参数 变化 。 

经 验 的 模型 只 有 在 实测 范围 内 才 有 效 的 ,因而 不 能 外 推 或 外 推 幅度 不 大 ,这 种 
模型 在 放大 方面 的 应 用 和 在 控制 方面 的 应 用 都 是 有 局 限 的 。 而 理论 模型 可 以 外 
推 , 且 应 用 广泛 ,因此 ,通常 在 条 件 许可 的 范围 内 ,总 是 尽 可 能 建立 机 理 的 模型 , 然 
后 ,再 有 目的 地 通过 “试验 "来 检验 和 校正 。 经 验 模型 的 优点 是 不 必 对 基础 理论 做 
大 量 的 研究 ,所 得 到 的 模型 较为 简单 。 因 为 直接 从 实践 中 来 , 故 不 必 担 心理 论 与 实 
际 的 差距 。 缺 点 是 就事论事”,“ 知 其 然而 不 知 其 所 以 然 ”, 过 程 实质 被 掩盖 起 来 ， 
往往 对 较 复杂 的 系统 抓 不 住 实质 问题 ,从 而 模型 效果 较 差 。 同 时 , 因 必 须 先 有 实际 
系统 (研究 对 象 ) 才 能 应 用 这 种 方法 , 故 对 新 的 过 程 开发 不 大 适用 ,除非 先 建立 试验 
装置 。 

“混合 模型 "或 半 机 理 半 经 验 模型 是 以 机 理 分 析 建 立 模型 的 结构 ,以 实验 为 依 
据 , 进 行 过 程 建 模 和 参数 估计 。 其 中 某 些 参数 有 一 定 的 物理 意义 ,而 某 些 参数 则 没 
有 特定 的 物理 意义 。 如 发 酵 过 程 中 的 Monod 模型 , 它 是 通过 理论 分 析 , 确 定 参数 
之 间 的 函数 关系 形式 ,再 通过 正常 操作 或 试验 数据 来 确定 此 函数 式 中 各 系数 的 大 
小 ,也 就 是 把 机 理 模 型 法 和 经 验 模型 法 结合 起 来 而 得 到 的 一 种 模型 。 

因此 ,数学 模型 的 建立 是 一 个 非常 复杂 的 问题 。 由 于 生命 科学 和 生物 工程 中 
的 模型 一 般 较 为 复杂 ,具体 机 理 较 难 确定 , 故 一 般 以 半 机 理 半 经 验 模型 .经 验 模型 
居多 。 


二 、 黑 箱 模型 介绍 


黑箱 模型 的 推导 过 程 是 将 整个 过 程 看 作为 一 个 “黑箱 ”, 仅 仅 考虑 进出 黑箱 的 
各 个 参数 之 间 的 关系 ,而 不 考虑 各 参数 在 黑箱 中 的 变化 情况 。 采 用 黑箱 模型 的 原 
因 是 因为 无 法 对 研究 对 象 作 深入 的 分 析 , 无 法 对 
所 研究 的 系统 做 充分 的 描述 。 

已 知 该 过 程 的 条 件 为 ri ，z:，…，z,( 即 为 输 
入 参数 ) ,结果 为 y( 即 为 输出 参数 ) ,分 析 y 和 各 参 
数 之 间 的 关系 , 即 得 ( 见 图 12 -1) 图 12- 1 黑箱 模型 


y= f(xi, zz，…，zo) 
该 模型 可 以 是 线性 模型 : 
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y=both filzi, 5) 十 加 (zy，zey rn) 十 … 
也 可 以 是 非 线性 模型 


y= fx19 zy es Zo bts bas es, bn) 


式 中 :b1，bo。，…，b» 为 模型 参数 。 
通过 对 过 程 实验 数据 的 回归 分 析 , 从 中 找 出 各 个 自 变量 和 因 变 量 之 间 的 关系 。 


三 、 数 学 模型 的 选择 


如 何 根据 实验 数据 的 特点 选择 合适 的 数学 模型 ,一 般 可 从 实验 数据 的 图 示 ( 如 
图 12- 2 一 图 12 - 6) 开 始 。 根 据 实验 数据 变化 的 曲线 形状 ,推测 数学 模型 的 形式 。 


y 











好 辣 


图 12-5 y= logsx 曲线 图 12-6 y= ew sinbr 曲线 


由 于 研究 数学 模型 的 方法 很 多 ,推导 模型 的 出 发 点 不 同 ,或 推导 模型 的 目的 不 
同 ,描述 具体 某 个 过 程 的 数学 模型 也 可 能 有 多 个 ,经 常 同时 有 几 个 模型 都 适用 , 同 
一 组 实验 数据 可 以 用 不 同 的 函数 式 进行 表示 。 从 众多 模型 中 选 出 最 合适 的 模型 ， 
即 是 模型 的 筛选 。 

最 佳 函数 式 的 选择 主要 是 针对 经 验 模型 . 半 机 理 半 经 验 模型 ,因为 机 理 模型 已 
经 基本 定型 ,很 少 有 再 选择 的 机 会 。 所 选择 的 模型 应 该 正确 包含 过 程 的 重要 变量 ， 
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正确 表示 各 个 参数 之 问 的 函数 关系 ,要 求实 验 结果 和 函数 表达 式 最 为 吻合 ,所 偏离 
的 程度 最 小 。 在 可 能 的 情况 下 ,要求 模型 尽量 简化 ,模型 参数 的 回归 便利 ,模型 的 
参数 能 够 有 一 定 的 物理 意义 。 





第 四 节 ”生命 科学 中 的 数学 模型 特征 


一 、 生 命 科 学 中 的 建 模 


生命 科学 中 的 模型 化 是 对 生命 科学 中 出 现 的 过 程 ,包括 静态 和 动态 的 过 程 采 
用 数学 语言 进行 定量 的 描述 ,从 而 用 于 该 过 程 的 进一步 研究 和 分 析 , 加 深 对 过 程 的 
了 解 。 生 命 科 学 现象 一 般 包 括 许多 物理 过 程 和 化 学 过 程 , 其 复杂 性 远 远 超 过 了 人 
们 的 想象 ,模型 和 模拟 技术 为 生命 科学 家 解决 这 种 复杂 系统 和 揭示 生命 系统 中 的 
奥秘 提供 了 一 种 强 有 力 的 工具 。 生 物 系统 中 有 群体 系统 .个 体系 统 、 组 织 系统 、 细 
胞 系统 ,生态 系统 和 环境 系统 等 ,各 个 系统 的 影响 因子 很 多 。 
生命 科学 建 模 必须 考虑 生命 现象 的 特征 。 首 先 , 生 命 活动 经 常 以 大 量 重复 和 
周期 性 循环 的 形式 出 现 ,并 受到 许多 随机 因素 的 干扰 ,生命 现象 一 般 都 是 随机 现 
象 ,需要 用 概率 和 统计 的 方法 进行 研究 ;其 次 ,生命 现象 中 各 个 方面 都 是 相互 联系 
和 相互 制约 的 , 须 综合 ,全面 地 考虑 问题 ;第 三 ,生命 物质 的 结构 和 生命 活动 的 方式 
经 常 是 不 连续 的 ,故常 需 采 用 离散 的 数学 方法 进行 研究 。 

生命 科学 中 的 建 模 的 困难 性 主要 在 以 下 三 个 方面 : 

(1) 生命 科学 中 的 机 理 复杂 ,通过 机 理 建 模 困 难 较 大 ,而 且 模 型 的 实用 性 也 存 
在 问题 ,通过 经 验 的 参数 回归 得 到 的 模型 应 用 范围 较 小 。 

(2) 生化 过 程 中 的 检测 手段 不 够 完全 ,特别 是 生化 参数 检测 困难 。 除 了 常用 
的 温度 ,pH 值 等 ,直接 反映 生化 过 程 状态 的 变量 ,如 菌 体 浓度 、 活 性、 细胞 的 呼吸 商 
等 尚 没有 很 合适 的 检测 手段 。 

(3) 由 于 生命 活动 的 特殊 性 ,许多 生命 科学 过 程 缺乏 强 有 力 的 控制 手段 ,而且 
很 多 过 程 是 不 可 逆 的 。 实 验 的 实施 还 受到 社会 .伦理 等 因素 的 限制 ,有 时 候 相 当 
困难 。 











此 ,建立 一 个 有 效 的 生命 科学 数学 模型 ,需要 做 许多 的 工作 。 本 书 仅 介绍 生 
命 科学 中 数学 模型 的 常用 建立 方法 、 数 学 模型 的 主要 类 别 和 影响 因子 的 参数 回归 。 
生命 科学 数学 模型 的 一 般 建立 过 程 和 前 面 类 似 ,其 建立 过 程 为 : 


生命 现象 的 机 理解 析 一 假设 或 选择 数学 模型 一 数学 模型 和 参数 的 确定 一 
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一 (包括 系统 辨识 和 模型 检验 )- 数 学 模型 的 应 用 


生命 科学 中 数学 模型 的 功能 也 和 一 般 的 数学 模型 类 似 ,如 : 

(1) 各 种 情况 下 功能 的 预测 ,如 反映 生化 .生理 状态 参数 之 间 的 数学 模型 。 

(2) 为 了 解 过 程 的 奥秘 ,间接 计算 或 导出 某 些 参 数 。 

(3) 对 生命 过 程 的 分 析 和 诊断 ,如 计算 机 专家 诊断 系统 的 开发 。 

(4) 对 生命 过 程 的 控制 等 ,包括 分 子 水 平 上 的 控制 细胞 水 平 上 的 控制 .工程 
水 平 上 的 控制 三 个 部 分 。 


二 、 生 命 科学 中 的 数学 模型 类 型 


由 于 生命 现象 和 生物 系统 的 复杂 性 ,生物 系统 绝 大 部 分 是 非 线性 系统 ,到 目前 
为 止 ,总 体 上 数学 模型 还 停留 在 比较 初级 的 阶段 。 生 命 现象 的 机 理 描述 ,特别 是 定 
量 表达 非常 困难 ,建立 相关 生命 过 程 的 机 理性 模型 不 太 容 易 , 因 此 生物 系统 的 模型 
多 为 经 验 模型 或 半 经 验 模型 ,模型 的 表示 形式 为 非 线 性 方程 的 形式 。 

进行 生物 系统 .生态 系统 建 模 的 主要 困难 是 对 所 研究 的 体系 或 系统 的 特征 变 
量 的 确定 和 有 关 重 要 变量 参数 的 辨识 。 在 生命 系统 中 ,含有 为 数 众 多 的 变量 和 参 
数 ,系统 本 身 又 带 有 非 线性 的 特点 。 为 了 突出 问题 ,说 明生 命 现 象 或 生命 过 程 的 特 
征 , 必 须 对 过 程 进行 简化 ,将 复杂 的 模型 分 解 ,保留 其 过 程 的 特征 变量 ,从 而 得 到 一 
个 简单 又 不 失真 实 的 模型 。 例 如 ,通过 对 生命 过 程 的 线性 化 处 理 和 减少 变量 的 个 
数 等 常用 方法 ,得 到 一 个 实用 的 模型 。 而 且 复杂 系统 的 数学 模型 经 常 可 以 分 解 为 
多 个 简单 的 模型 。 许 多 时 候 ,模型 是 以 微分 方程 , 非 线 性 方程 .矩阵 的 形式 出 现 , 而 
且 方程 的 求解 经 常 需要 借助 于 计算 机 数值 方法 。 

简单 的 数据 模型 包括 静态 过 程 的 描述 和 物性 数据 的 计算 。 如 生命 科学 中 常用 
的 物性 参数 计算 ,参数 有 系统 的 温度 .压力 ,物质 的 体积 ,溶质 的 溶解 度 ,氧化 还 原 
电位 、 物 质 含量 ,以 及 各 个 组 分 的 其 他 物理 、 化 学 参数 等 。 

对 一 个 生命 科学 中 的 过 程 进 行 全 面 的 模型 化 ,主要 从 五 个 方面 考虑 , 即 物 质 平 
衡 . 能 量 平衡 .动量 平衡 过程 的 动力 学 和 其 他 一 些 生 物 特性 ,如 生物 体 的 生理 特 
性 ,遗传 特性 ,在 实际 过 程 中 可 能 会 包含 其 他 的 工程 问题 。 在 此 基础 上 对 各 参数 作 
综合 的 分 析 和 数据 的 回归 ,了 解 参数 之 间 的 相关 性 。 从 考虑 建立 数学 模型 的 角度 
看 ,有 分 子 角度 、 细 胞 角度 .工程 角度 ,以 及 它们 的 交叉 组 合 形式 。 

在 生命 科学 和 生物 丁 程 中 ,数学 模型 涉及 各 个 领域 ;如 生物 学 .医学 .农业 、 食 
品 \ 环 境 、 资 源 等 ,其 中 生化 工程 .生态 系统 中 的 数学 模型 最 为 常见 ,它们 也 是 应 用 
数学 模型 最 普遍 的 领域 。 如 生化 反应 动力 学 模型 .来 自生 态 学 中 的 群体 和 个 体系 
统 模 型 .统计 生态 学 模型 .药物 动力 学 模型 及 生态 图 形变 化 模型 等 。 所 研究 的 数学 
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-模型 ,为 生化 过 程 的 自动 化 控制 .过 程 的 优化 ,过程 的 模拟 .生态 平衡 的 研究 作出 了 
很 大 的 贡献 。 生 命 科 学 数学 模型 的 基本 建立 方法 可 以 适用 于 不 同 的 和 生命 相关 的 
过 程 ,如 离子 交换 、 双 水 相 芋 取 、 吸 附 分 离 . 凝 胶 分 离 .细胞 沉淀 等 生化 分 离 过 程 ,发 
酵 模型 酶 反应 模型 等 生物 反应 过 程 ,以 及 生物 种 群 的 变迁 和 分 布 等 。 当 然 , 随 着 
生物 技术 的 发 展 ,人 们 对 控制 系统 提出 了 更 高 的 要 求 , 单 凭 经 验 或 经 典 的 试验 数据 
来 控制 生产 已 不 能 满足 需要 。 而 最 优化 自动 控制 过 程 的 基本 问题 是 必须 对 过 程 进 
行 数学 模拟 ,提出 合适 的 数学 模型 。 

分 子 生物 学 中 的 模型 ,目前 还 比较 简单 ,但 是 发 展 比较 迅速 。 如 数学 遗传 学 模 
型 反映 基因 的 频率 变化 ,遗传 因子 和 后 代 关 系 , 对 生物 进化 的 效应 或 影响 ,群体 遗 
传 学 模型 反映 基因 的 突变 、 迁 移 、 选 择 等 ;现代 遗传 学 常 以 数学 模型 形式 讨论 遗传 
参数 及 其 选择 调控 ,如 遗传 率 ,重复 率 、 育 种 率 、 表 型 相关 、 遗 传 相关 、 环 境 相关 等 。 
数学 模型 的 应 用 使 人 们 对 于 个 体 和 群体 的 遗传 结构 问题 有 了 更 深 的 了 解 。 随 着 生 
物 信 息 学 的 发 展 ,在 分 子 生物 学 中 的 建 模 将 会 越 来 越 广泛 。 


本 章 学 习 要 点 ， 
(1) 数学 模型 的 建立 过 程 。 
(2) 数学 模型 的 简化 。 
(3) 数学 模型 的 选择 。 
(4) 数学 模型 的 分 类 。 


~ 


第 十 三 章 ”生命 科学 中 常见 的 数学 模型 


本 章 主 要 介绍 生命 科学 中 的 几 种 常见 数学 模型 ,通过 这 些 数 学 模型 的 建立 过 
程 , 了 解 生命 科学 的 建 模 规 律 。 


第 一 节 ”生物 传递 模型 


生命 科学 中 传递 过 程 模型 主要 有 生化 传递 模型 .生化 分 离 工 程 模型 .生物 物质 
的 扩散 模型 等 ,它们 都 可 以 从 系统 的 物料 衡 算 .能 量 衡 算 ,动量 衡 算出 发 进行 推导 。 
它们 所 涉及 的 目标 是 生命 系统 ,其 中 微生物 .细胞 是 研究 的 重要 对 象 。 

如 生化 传递 模型 ,其 中 人 体 中 铁 元 素 的 传输 数学 模型 ,研究 铁 元 素 通 过 食用 后 
在 人 体内 的 消化 吸收 过 程 ,了 解 铁 元 素 在 人 体 的 肝 . 脾 . 血 效 、 骨 髓 .血红 细胞 中 的 
分 布 ,及 从 人 体 中 的 排放 等。 

又 如 生化 分 离 工程 模型 ,其 中 有 人 工 肾 的 数学 模型 。 人 工 肾 是 一 种 渗透 器 ,可 
代替 肾 胜 在 人 体 血 液 循环 中 具有 滤 除 人 体 产生 的 废物 之 功能 。 血 液 从 人 体 中 流出 
并 流入 到 渗透 器 ,而 被 清洗 后 的 血液 则 反方 向 流出 渗透 器 。 生 物 物 质 的 扩散 模型 
有 血液 传递 模型 .心血 管 系统 模型 等 。 

下 面 以 典型 的 生物 物质 在 细胞 内 外 的 扩散 模型 为 例 ,介绍 数学 建 模 过 程 。 

[ 例 13 - 1] 溶液 分 子 通过 细胞 膜 的 扩散 ， 
细胞 悬浮 在 浓度 为 co 的 液体 中 ,为 建立 模型 , 假 | 二 3 





设 细胞 的 体积 不 变 , 液 体 的 浓度 不 变 ,并 假设 溶 | 一 
液 在 细胞 内 分 布 均匀 ,浓度 随时 间 变 化 , c = | 一 
c(t)。 

由 于 细胞 内 外 的 溶液 浓度 不 同 ,溶液 分 子 将 
通过 细胞 膜 由 细胞 外 的 溶液 扩散 进入 细胞 ,同时 
细胞 内 也 有 部 分 分 子 流入 溶液。 其 分 子 流动 如 
图 13- 1 所 示 。 

以 细胞 为 研究 对 象 ,如 果 co 高 于 <(2) , 则 分 子 的 净 流 动 是 从 溶液 流入 细胞 ; 反 
之 ,分 子 的 净 流 动 是 从 细胞 流入 溶液 。 设 细胞 内 溶液 的 质量 为 mm 二 zz(9，A 为 细 
胞 膜 的 面积 ,V 是 细胞 的 体积 , 则 有 








图 13-1 细胞 内 外 溶液 的 
分 子 流动 
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m(t) 一 V。c(0， 其 净 流 率 为 dm/dt 
根据 Fick 扩散 定律 , 则 得 传递 方程 
dm/dt 一 AA(co 一 c) 
式 中 :为 正常 数 ,取决 于 细胞 膜 的 结构 和 厚度 ,也 可 称 为 膜 的 渗透 率 。 
将 传递 方程 转化 为 浓度 的 表示 形式 : 
dc/d = kA/V. (co 一 c) 
可 以 求 得 
< 一 K.exp( 一 名 +a 


式 中 :K 为 积分 常数 ,可 以 用 初始 条 件 确定 。 而 当 ! ~ oo 时 ,c(z) 的 极限 值 为 co 。 

以 上 可 得 到 最 基本 的 生物 物质 扩散 模型 。 如 将 扩散 模型 应 用 于 生物 物质 的 离 
心 分 离 过 程 , 可 以 得 到 离心 分 离 模型 。 

高 速 离心 机 是 生物 学 上 最 常用 的 实验 工具 之 一 , 它 能 够 通过 对 生化 溶液 施加 
一 个 强大 的 离心 力 场 ,从 而 使 溶液 中 的 各 个 组 分 得 以 分 离 。 用 高 速 离心 机 确定 大 
分 子 的 相对 分 子 质量 和 扩散 常数 ,或 利用 大 分 子 的 相对 分 子 质量 不 同 进行 分 离 , 是 
实验 室 常用 之 方法 。 它 的 数学 模型 如 下 : 

一 一 Dp¥ 十 cx 
式 中 :j 为 溶质 流 密度 。 等 式 右边 第 一 项 代表 扩散 流 密度 ,第 二 项 代表 对 流 或 沉降 
密度 。 这 里 的 浓度 c 是 径 向 位 置 r 和 时 间 t 的 函数 ,u 是 溶质 分 子 的 速度 : 
u = dr/dt 


将 扩散 模型 用 于 其 他 系统 ,如 [ 例 13 - 2]。 

[ 例 13-2] 定量 描述 土地 生物 处 理 有 机 污染 物 过 程 的 综合 数学 模型 。 数 学 
模型 假定 为 球体 扩散 模型 。 在 土壤 系统 中 ,土壤 颗粒 可 被 概括 为 多 孔 性 球形 颗粒 ， 
具有 内 部 孔隙 和 外 部 孔隙 ,内 外 孔隙 中 都 含有 水 ,这些 水 分 别称 为 颗粒 内 部 水 相 和 
外 部 水 溶液 。 在 初始 状态 下 ,有 机 污染 物 可 以 存在 于 土壤 颗粒 内 部 或 外 部 的 水 溶 
液 中 ,微生物 则 均匀 分 布 于 外 部 水 溶液 而 不 能 进入 颗粒 内 部 ,有 机 污染 物 的 生物 降 
解 过 程 只 能 发 生 于 土壤 颗粒 外 部 的 水 溶液 中 ,系统 内 温度 相同 并 保持 恒定 。 有 机 
污染 物 在 上 述 土壤 系统 中 进行 生物 降解 过 程 的 物料 平衡 方程 如 下 : 





asa as ,aCe _1a Ce 
QWp+0 一 Wp 人 +0 和 :一 去 昼 [Dor 从 | 
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式 中 :Se 为 污染 物 可 逆 吸 附 于 土壤 颗粒 内 部 固定 相 的 浓度 ,mg/kg; Si 为 污染 物 屏 
项 于 土壤 颗粒 内 部 固定 相 的 质量 浓度 ,mg/kg; Cr 为 污染 物 在 土壤 颗粒 内 孔隙 水 
相 的 浓度 ,mg/L; p 为 土壤 介质 的 密度 ,kg/L;6 为 土壤 颗粒 内 孔隙 率 ; Dr 为 污染 
物 在 土壤 颗粒 内 孔隙 水 相 的 扩散 系数 ,cm?/s; ! 为 时 间 ,s; 7 为 沿 土壤 颗粒 半径 方 
向 的 极 距 ,mm。 结 合用 线性 吸附 等 温 线 表示 的 可 逆 吸 附和 解吸 过 程 ,用 假 一 级 反应 
动力 学 方程 表示 不 可 道 土 壤 屏蔽 反应 过 程 ,用 Monod 方程 表示 生物 降解 过 程 , 较 好 
地 建立 了 数学 模型 ,解决 了 上 述 问题 ( 刘 凌 . 环境 科学 学 报 []],2001,21(1))。 





第 二 节 ”生物 种 群 的 指数 增长 模型 


生物 种 群 的 变化 是 一 个 随时 间 变 化 的 连续 过 程 , 所 采集 的 数据 经 常 是 由 一 系 
列 离散 的 数据 组 成 ,如 图 13 - 2 所 示 。 建 立 数学 模型 时 ,一 般 需 对 数据 进行 连续 可 
微 处 理 , 从 而 得 到 一 个 或 一 系列 微分 方程 ,结合 种 群 变化 的 特征 ,了 解 种 群 变化 的 
过 程 。 


ky 


细胞 数 对 数值 








O 





图 13-2 分 批 培养 条 件 下 微生物 的 生长 曲线 
[ 例 13-3] 微生物 细胞 指数 增长 模型 。 细 胞 数目 N 作为 一 个 随时 间 变 化 的 
连续 变量 ,典型 的 变化 过 程 是 指数 增长 。 根 据 指数 变化 特征 ,其 变化 关系 为 党 = 


AN ,或 可 表示 为 N = ce = Noer ,这 是 一 个 典型 的 指数 增长 模型 。 

对 于 许多 具体 的 情况 ,该 模型 有 一 些 形式 上 的 变化 。 如 在 一 个 给 定 的 培养 基 
内 ,细菌 或 其 他 微生物 不 可 能 无 限制 地 一 直 增 长 下 去 ,经 常 出 现 营养 缺乏 的 情况 ， 
此 时 微生物 的 群体 生长 模型 为 
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NN RN: (k>0,B8>0) 


由 于 等 式 右面 的 后 一 项 是 负 值 , 故 N 不 会 无 限制 增长 。 


常用 的 微生物 生长 模型 为 Monod 模型 ,Monod 于 1950 年 提出 的 & 的 经 典 数 
学 式 为 


k(c) 二 如 RK 千 c 


还 有 其 他 许多 修正 的 微生物 生长 模型 ,如 Novick(1955 年 ) 模 型 : 


dN 
一 AN 一 9N 


Teisier 模型 
A 一 pmxS/(Ks+S)— Ki.(S—S.) 
它们 之 间 的 区 别 是 所 考虑 的 过 程 特性 不 同 , 提 出 问题 的 出 发 点 不 同 , 从 而 方程 


的 形式 不 同 ,模型 参数 的 数目 不 同 。 
[ 例 13-4] 生物 种 群 模型 也 适用 于 人 口 增长 过 程 ,如 表 13 - 1 所 示 : 


表 13-1 近 300 年 来 的 世界 人 口 增长 数据 
1650 | 1750 | 1820 1974 | 1982 | 1987 








式 中 : ~ 一 0 一 d, 2 为 出 生 率 ,d 为 死亡 率 ,r 为 模 
型 参数 (如 图 13 - 3) 。 

通过 回归 模型 参数 ,发 现 中 早期 的 数据 拟 只 
合 较 好 ,可 对 人 口 发 展 趋势 进行 粗略 的 预测 。 
后 期 的 数据 偏离 总 体 模型 较为 严重 ,这 可 能 是 
由 于 近 20 年 来 世界 各 国医 疗 条 件 的 改善 ,大 规 6 
模 战 争 的 减少 导致 死亡 率 下 降 的 缘故 。 

在 生命 科学 中 ,S 型 生态 基线 也 是 一 种 典型 。 全 模型 册 线 
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曲线 ( 见 图 13 - 4) ,反映 S 型 曲线 的 模型 也 有 很 多 ， 
其 中 Logistic 模型 是 应 用 较 广 的 一 种 。 

在 生物 学 特别 是 生态 学 中 , Logistic 分 布 是 一 
具有 实用 价值 的 连续 型 分 布 。 该 分 布 可 应 用 于 虫 
害 的 调查 实验、 预测 ,以 及 疾病 的 实验 和 治疗 工作 Ki(l+e’) 
等 。 如 生物 群体 的 Logistic 增生 曲线 .昆虫 化 晴 率 、 
死亡 率 等 都 属于 这 类 分 布 。 在 生态 学 上 ,S 型 生态 
曲线 都 可 以 广泛 使 用 Logistic 曲线 。Logistic 曲线 图 13-4 Logistic 
方程 为 模型 曲线 


N 











K a RN 
I 或 In N a—bt 


式 中 :K 是 在 上 相当 大 时 N 所 能 达到 的 最 大 值 。Logistic 曲线 的 特征 是 开始 时 增 
长 缓慢 ,而 在 以 后 一 个 阶段 内 增长 迅速 ,达到 某 个 限度 后 ,增长 又 缓慢 下 来 ,总 体 呈 
S 形 。 
具体 的 应 用 例子 如 草 履 虫 在 一 种 营养 液 中 的 培养 增长 过 程 (Gause,， 1934 年 )， 
不 同 培养 天 数 下 草 履 虫 的 数目 如 表 13- 2 所 示 。 
表 13-2 不 同 培养 天 数 下 草 腹 虫 的 数目 
wd [ol 1|2 T 3 4 5 6 7 8 
N/ 虫 只 数 | 2 20 135 320 374 378 380 381 381 
又 如 家 畜 的 生长 数据 基本 符合 Logistic 曲线 ,如 测 得 某 种 肉鸡 食用 饲料 后 的 
生长 数据 如 表 13 - 3 所 示 。 
表 13-3 肉鸡 食用 饲料 后 的 生长 数据 
食用 周 数 2 4 6 8 10 斑 14 
肉鸡 重量 /kg | 0.30 0. 86 1.73 2.20 2.47 2.67 2.80 











第 三 节 ”生物 种 群 相互 作用 模型 


在 自然 界 中 ,生物 种 群 之 间 相 互 依存 .相互 制约 ,它们 的 相互 作用 有 共生 、 竞 
争 .寄生 、 掠 食 等 形式 ,或 兼 而 有 之 ,非常 复杂 。 
下 面 介 绍 猎手 - 食 饵 系统 的 经 典 生长 数学 模型 (Lotka & Volterra, 1925 年 ) 的 
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建立 过 程 。 设 时 刻 上 时 食 饵 的 数目 为 x 二 x(z), 猎手 的 数目 为 y = (2)， 假定 
z(0D)，y(1) 都 是 时 间 的 可 微 函 数 。 考 虑 At 时 间 间 隔 中 的 两 者 数目 变化 : 


( 食 饵 的 数目 变化 ) 一 ( 食 饵 的 自然 增长 ) 一 ( 食 饵 受 到 猎手 的 损害 数目 ) 
(猎手 的 数目 变化 ) 二 (由 于 捕食 使 猎手 增长 的 数目 ) 一 (猎手 的 自然 损害 率 ) 


以 微分 形式 表示 , 即 为 


dz/d: 一 〈 食 饵 的 自然 增长 率 ) 一 ( 食 饵 的 损害 率 ) 
dy/dt 二 (猎手 的 出 生 率 ) 一 (猎手 的 死亡 率 ) 


由 于 食 饵 的 自然 增长 率 与 x 成 比例 ,假定 为 a. x (a > 0)。 食 饵 的 损害 率 则 依 
赖 于 z(0，?y(0 ,并 和 <z(0，y(0) 成 比例 , 即 假定 为 6。zy (5 > 0)。 而 猎手 的 出 生 
率 依赖 于 食物 的 供给 和 其 本 身 群 体 的 数量 ,其 出 生 率 和 z(t)，y() 成 比例 ,可 假定 
为 c* zy (ce > 0)。 猫 手 的 死亡 率 则 与 本 身 数量 成 比例 ,假定 为 4，x (4 > 0)。 

根据 以 上 的 简化 假设 ,微分 方程 即 为 

dr/dt = ar—bry 
dy/d = cry—dy 
该 方程 在 确定 部 分 参数 后 ,可 采用 计算 机 利用 数值 方法 求解 。 如 原生 生物 中 


的 草 履 虫 以 酵母 菌 为 食 饵 ,两 者 之 间 的 关系 即 是 一 个 典型 的 例子 ( 见 图 13 - 5), 可 
以 知道 两 个 群体 数目 在 整个 过 程 中 作 周 期 性 变化 。 














0 2 4 6 8 10 1 14 1 18 
天 数 


图 13-5 草 履 虫 与 酵母 菌 的 群体 密度 波动 曲线 (Gause,，1935) 
设 某 一 系统 的 简单 数学 模型 为 
dr/dt = r+y 
dy/dt =— z+y 


假定 初 值 : x(0) = y(0) = 1 000, 通过 求解 常 微 分 方程 的 初 值 问题 , 即 可 确定 
工 和 y 的 变化 趋势 ,以 及 食 饵 何 时 被 消灭 。 


对 于 其 他 两 个 相互 作用 的 群体 系统 ,如 群体 关系 为 宿主 和 寄生 虫 ,它们 之 间 的 
关系 也 可 以 表示 为 类 似 的 公式 ,如 


| 二 hz 一 zy 


三 
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式 中 :a 是 一 个 正常 数 ;azxy 是 个 表示 死亡 率 的 量 ;f 是 常数 , 0 一 了 入 1。 

同 理 , 可 以 得 到 其 他 相互 作用 的 数学 模型 ,包括 共 栖 (commensalism) 模 型 . 共 
生 (mutualism) 模 型 ,竞争 (competition) 模 型 等 ,根据 它们 各 自 的 特点 ,模型 均 可 表 
示 为 微分 方程 的 形式 : 


宣 =xr* f(r, y) 
中 一 y。&gCr，y) 
以 此 可 以 类 推 至 ”种 种 群 系统 的 相互 作用 关系 ,其 表示 形式 为 : 
dn/dt = Tifi(x1, Tr, Ia) 
dd = zfe(x1s Xa ,Xn) 
二 /dt = zf Ti, Tas ,Xn) 


第 四 节 ”生态 数学 模型 


生态 数学 模型 的 应 用 极为 广泛 ,如 大 气 中 污染 物质 的 分 布 模型 物种 的 分 布 模 
型 .森林 的 开发 管理 模型 .病虫害 综合 防治 模型 ,生态 毒 理 学 模型 ,特别 是 生态 系统 
中 的 预测 模型 和 针对 问题 的 解决 模型 。 研 究 生 态 数学 模型 所 采用 的 数学 方法 有 微 
分 方程 .积分 微分 方程 ,概率 论 与 数理 统计 到 生物 控制 论 、 随 机 过 程 论 .最 优化 原理 
等 。 模 型 形式 有 统计 学 模型 .动力 学 模型 .数学 规划 模型 等 。 生 态 学 研究 的 定量 
化 .模型 化 是 现代 生态 学 研究 的 发 展 趋势 。 

在 生态 系统 模型 的 构建 中 ,通过 对 生态 环境 信息 的 综合 分 析 , 可 对 生态 系统 特 
性 诸如 整体 性 、 稳 定性、 敏感 性 .多 样 性 及 系统 优化 .系统 控制 作 定量 分 析 , 但 应 遵 
循 一 些 基 本 原则 (Wilson，1974 年 ) : 

(1) 明确 所 构建 的 生态 系统 模型 的 目标 。 
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(2) 在 明确 目标 的 基础 上 对 生态 系统 成 分 进行 识别 。 搞 清楚 组 成 生态 系统 的 
各 类 变量 及 其 变化 水 平 , 还 要 了 解 哪些 变量 为 “可 控制 变量 ”, 可 用 于 对 过 程 的 调节 
和 预测 。 

(3) 处 理 好 各 个 变量 随时 间 变化 的 问题 。 生 态 模型 多 为 动态 模型 ,要 确定 对 
于 系统 变化 有 决定 意义 的 时 间 。 

(4) 了 解 所 建立 的 生态 系统 模型 的 适用 范围 ,并 且 估计 模型 在 应 用 中 的 有 效 
程度 。 
(5) 对 所 构建 的 生态 系统 模型 进行 认真 的 检验 。 
常用 的 生态 分 布 模型 有 二 项 分 布 泊 松 (Poisson) 分 布 等 ,如 下 例 。 

[ 例 13-5] 对 常见 的 在 单个 甘蓝 植物 里 的 甘蓝 蝴蝶 (或 称 为 粉 蝶 ) 的 卵 分 布 
情况 建立 一 个 数学 模型 。 其 实验 数据 可 以 用 概率 上 的 负 二 项 分 布 加 以 描述 , 即 每 
棵 植物 里 卵 的 个 数 及 符合 下 面 的 概率 函数 : 


hk 一 1 


P(H=)= GC 


josG 一 Ch=0,1, 2,%) 
式 中 :&0, 0 二 p<=1。 

而 对 于 生物 学 研究 中 的 小 概率 事件 ,可 以 用 泊 松 分 布 来 描述 ,特别 是 当 二 项 分 
布 的 p 过 0.1, np 二 5 时 ,可 以 用 泊 松 分 布 近似 。 


泊 松 分 布 的 概率 函数 为 P(z) 一 时, 它 的 数学 期 望 和 方差 为 4 一 X07 一 4。 


并 
如 样品 中 的 细菌 数 分 布 一 般 符 合 泊 松 分 布 。 对 某 样品 进行 病菌 的 检测 ,将 样 
品 中 各 个 小 格 区 域 的 细菌 数目 加 以 计数 , 按 细菌 数 的 多 少 记 录 小 格子 数 , 得 到 的 数 
据 如 表 13 - 4 所 示 。 








表 13-4 细 菌 数 








计算 时 采用 细菌 平均 数 作为 数学 期 望 4 的 估计 值 。 

其 他 的 应 用 实例 如 在 物种 分 布 上 研究 某 区 域 昆 虫 群落 分 布 的 情况 ;在 医学 上 
用 回归 方程 研究 老年 人 的 健康 状况 及 疾病 分 布 情况 ,研究 不 同 民族 的 人 体 特征 数 
据 ; 在 环境 保护 上 研究 废水 的 生物 处 理 模型 ;在 生物 资源 上 研究 海洋 鱼 类 的 数量 周 
期 性 变化 等 。 
学 者 全 为 民 等 研究 了 通过 使 用 数学 模型 来 模拟 湖泊 富 营 养 化 的 发 生 , 预 测 湖 
泊 对 不 同 管理 措施 的 响应 ,以 便 找 出 合理 的 治理 措施 。 他 们 总 结 了 湖泊 富 营养 化 
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模型 的 三 个 发 展 阶 段 :@ 单 限制 因子 模型 ,如 磷 模 型 ;@ 多 限制 因子 模型 ,如 浮游 植 
物 初 级 生产 力 估 测 模型 ;@ 生 态 -动力 学 模型 ,目前 的 主流 模型 。 随 着 人 们 对 湖泊 
生态 系统 认识 的 提高 和 计算 机 技术 的 发 展 ,生态 与 水 动力 耦合 模型 .面向 对 象 模型 
和 神经 网 络 模型 等 具有 良好 的 发 展 前 景 (生物 多 样 性 ,2001,9(2))。 

具体 的 如 营养 盐 模型 ,由 于 湖水 中 总 磷 、 总 氮 的 浓度 受 湖 外 负荷 的 很 大 支配 ， 
并 旦 明显 的 正 相关 关系 ;湖水 中 总 磷 浓 度 与 藻类 生物 量 的 代表 性 参数 叶绿素 a 之 
间 存 在 明显 的 正 相关 关系 ;湖水 中 总 磷 的 年 平均 浓度 与 透明 度 之 间 存 在 明显 的 负 
相关 关系 。 基 于 湖水 总 磷 浓 度 与 各 水 质 参 数 之 间 存 在 的 相关 关系 , Vollenweider 
于 1975 年 提出 了 湖水 中 总 磷 浓 度 的 模型 方程 ,以 后 经 过 多 次 计算 验证 ,此 模型 被 
称 为 “简单 的 沉积 模型 "。 方 程 为 





VB=wW-Q.P-u.A.p, 


式 中 :V 为 湖泊 容量 ,m? ;p 为 总 磷 浓 度 ,mg/mi ;1 为 时 间 ,a;W 为 磷 年 负荷 量 , mg/ 
aiQ 为 湖水 流出 量 ,m /aiw 为 沉积 速率 ,m/a;A 为 湖泊 表面 积 ,m? 。 

在 生态 学 的 生长 模型 中 物种 与 其 形态 参数 .外 界 条 件 之 间 关 系 可 采用 统计 学 
方法 研究 ,如 树木 的 生长 状况 与 其 高 度 直径、 树叶 大 小 .光合 作用 强度 等 之 间 的 关 
系 ;甘薯 的 生长 中 昔 块 重量 与 呼吸 强度 之 间 的 关系 ,根据 数据 特点 建立 线性 回归 模 
型 或 二 次 回归 模型 。 又 如 莫 小 阳 ( 生 命 科 学 研究 [J],4(2),2000) 研 究 了 野生 鳌 体 
重 和 养殖 乏 体 重 与 其 形态 指标 之 间 存 在 的 多 元 线性 关系 ,分 析 孜 体重 与 背 甲 长 、 
背 甲 宽 , 腹 甲 长 . 眼 间 距 、 体 高 等 13 个 形态 参数 之 间 的 关系 ,分 别 得 到 了 线性 回归 
方程 。 


第 五 节 ”药物 动力 学 模型 


药物 动力 学 在 药物 研究 中 的 应 用 范围 很 广 ,20 世纪 50 年 代 , 由 于 药理 学 家 认 
识 到 药物 对 机 体 的 作用 是 由 机 体 对 药物 的 作用 所 支配 ,所 以 药理 学 的 基本 概念 被 
一 分 为 二 。 经 典 的 药理 学 被 界定 为 药 效 学 一 一 研究 药物 对 机 体 的 作用 。 另 外 增加 
的 内 容 一 一 机 体 对 药物 的 作用 被 称 为 药物 动力 学 ,一 般 泛 指 的 药物 动力 学 包括 药 
效 动力 学 和 药物 动力 学 。 药 理 效应 只 有 当 药 物 或 其 生物 代谢 产物 到 达 身 体 的 适当 
作用 部 位 ,并 维持 足够 的 浓度 才能 获得 。 药 物 浓度 在 疗效 中 起 决定 作用 ,所 以 剂量 
-浓度 -效应 关系 研究 模式 广 为 使 用 。 从 这 一 模式 可 看 出 剂量 是 影响 浓度 的 主要 因 
素 之 一 ,而 且 是 可 控 因 素 。 而 另 一 主要 影响 因素 是 药物 在 体内 的 过 程 , 即 药物 在 体 
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内 的 吸收 (absorption) .分 布 (distribution) .代谢 (metabolism) 和 排泄 (elimination), 通 
常 所 说 的 ADME 过 程 。 这 些 都 是 药物 动力 学 的 研究 内 容 。 

药物 在 人 体 血液 中 浓度 分 布 规律 的 研究 是 药物 学 的 重要 课题 之 一 。 这 对 于 研 
究 给 药 过 程 和 药物 的 生物 利用 度 有 重要 意义 ,有 助 于 了 解 不 同 给 药方 式 的 差异 . 药 
物 安全 性 能 等 ,如 口服 .静脉 注射 ,肌肉 注射 等 。 

以 药物 吸收 过 程 的 动力 学 为 例 ,人 体内 
注射 人 药物 后 ,其 在 血液 中 的 浓度 y 和 注射 中 -方法 2 
时 间 : 呈 以 下 关系 : 


dy/dt =— ky 


式 中 的 常数 上 可 由 实验 确定 。 该 方程 对 于 许 | 
多 药物 ,特别 是 青霉素 等 药物 注射 非常 适用 。 
该 方程 的 性 状 是 指数 衰减 过 程 。 而 多 次 注射 ”2 2 43 时 间 8 2 
药物 后 ,人 体 血 液 中 浓度 为 各 次 浓度 的 累加 图 13-6 不 同 注射 方法 的 
(参见 图 13 - 6) ,从 而 可 以 根据 该 模型 分 析 药 药物 浓度 变化 
物 的 注射 用 量 。 

大 多 数 药物 在 体内 的 吸收 和 分 布 符合 上 述 方程 。 但 也 有 不 符合 的 情况 ,如 适 
合 于 采用 Markov 方程 进行 描述 。 近 年 来 ,测定 生物 体内 药物 及 代谢 物 的 高 灵敏 
高 特异 性 的 方法 在 不 断 发 展 ,使 药物 动力 学 的 研究 得 以 广泛 深入 。 药 物 动 力学 研 
究 揭 示 :@D 药 物 进入 体内 符合 一 定 的 数学 动力 学 模型 ,上 且 存在 着 明显 的 个 体 差异 ; 
@@ 药 物 在 体内 的 动力 学 过 程 受 到 病人 生理 和 病理 等 因素 的 影响 ;@ 药 物 的 体液 浓 
度 与 疗效 和 毒性 有 一 定 的 关联 性 。 临 床上 最 直观 地 判断 药物 使 用 是 否 合理 的 指标 
是 药理 效应 ,因此 对 药 效 动力 学 的 研究 也 愈 来 愈 引 起 人 们 的 重视 。 药 效 动 力学 主 
要 是 研究 药物 在 作用 部 位 的 浓度 与 其 在 体内 产生 效应 间 的 平衡 关系 ,揭示 药物 的 
时 间 浓度 效应 关系 的 特征 。 临 床 药 效 学 的 应 用 使 合理 用 药 从 临床 药 动 学 发 展 到 
药物 动力 学 , 药 效 学 结合 模型 ,将 药物 治疗 学 提高 到 一 个 更 高 的 水 平 。 

由 于 能 在 人 体重 复 定量 而 有 意义 的 药 效 学 指标 不 多 ,使 药物 动力 学 的 研究 遇 
到 一 些 困难 ,但 国内 外 仍 用 适当 的 数学 模型 成 功 地 模拟 描述 了 许多 药物 在 体内 的 
浓度 与 药 效 之 间 的 关系 。 如 抗 心 律 失常 药物 奎 尼 丁 和 普 鲁 卡 因 胺 ,8B 受 体 阻 断 剂 
贝 凡 洛 尔 (Bevantolol) , 钉 通 道 阻 滞 剂 硝 茜 地 平 ,H2 受 体 阻 断 剂 法 莫 替 丁 等 。 

以 药 效 动力 学 的 模型 为 例 说 明 数学 模型 在 药学 上 的 应 用 ,具体 的 药 效 学 模型 
有 ( 刘 皋 林 . 药学 进展 [J]],2000,24(2)): 

1) 线性 模型 






E=S.C+E 


0 


式 中 :已 为 效应 ;S 为 直线 的 斜率 ;C 为 药物 浓度 ;Eo。 表示 C 一 0 时 的 效应 , 称 为 基 
线 效应 。 该 模型 的 特点 是 比较 简单 。 其 主要 缺点 是 对 大 部 分 药物 来 讲 , 浓 度 与 药 
效 间 关 系 的 线性 仅 存在 于 中 间 范 围 ,而 在 高 或 低 浓度 时 , 尚 不 能 准确 预测 药 效 。 
2) 对 数 线性 模型 
E=S.lgC+I 


式 中 :T 是 任意 常数 ,无 物理 意义 。 该 模型 在 非 线性 回归 方法 推广 以 前 , 曾 被 广泛 
地 用 于 描述 体内 20% ~80% 药 物 浓度 时 ,浓度 对 数 与 效应 之 间 所 呈现 的 线性 关 
系 。 但 该 模型 不 能 预测 浓度 为 零 时 的 基线 效应 ,缺乏 确定 最 大 效应 的 能 力 。 
3) Ene 模型 (HILL 方程 ) 
EdeC 
EC +C 
HILL 方程 为 效应 与 浓度 关系 的 米 氏 方程 式 ,得 自 简单 的 药物 受 体 相互 作用 
模型 。 式 中 :Ew 是 药物 所 能 产生 的 最 大 效应 ,ECso 是 产生 50% Emx 时 的 药物 浓 
度 。 该 模型 可 预测 一 种 药物 所 能 达到 的 E,。，, 显 示 了 与 临床 常见 效应 相 一 致 的 结 
果 , 即 大 量 增 加 的 药物 浓度 仅 引起 效应 的 小 量 增加 。 另 外 , 它 可 预测 无 药物 存在 时 
的 临床 表现 , 即 为 药物 的 无 效应 。 这 两 个 性 质 是 以 往 最 广泛 采用 的 对 数 线性 模型 
所 缺乏 的 。 
4) 抑制 性 Er 模型 





Ew°C 
Tw FE 
式 中 :EE。 是 不 给 药 时 出 现 的 效应 , IC 是 产生 50%% 最 大 抑制 效应 时 所 需 浓度 。 当 
药物 呈 抑 制作 用 需 转换 数据 时 ,可 使 用 此 模型 , 它 的 形状 与 Er 模型 相反 ,斜率 为 
负 值 。 

5) S 型 En 模型 


E=E— 





Eee。 Cs 

ECs + 
该 方程 又 称 为 Hill 经 验 公 式 或 Wagner 公式 。 式 中 :S 是 影响 曲线 斜率 、 决 定 
昌 线 陡峭 程度 的 参数 , 它 可 以 没有 药理 意义 ,也 可 以 是 非 整 数 。 当 S = 1 时 ,得 到 
通常 的 双 曲 线 Ew 模型 ; 当 S 大 于 1 时 ,方程 成 为 S 形 曲线 ,曲线 中 间 部 分 的 斜率 
格外 大 ,并 可 能 达到 更 接近 实际 的 最 大 效应 值 ;如 果 S 小 于 1, 则 中 间 部 分 的 斜率 
较 小 ,为 平缓 型 曲线 。S 形 Eww 模 型 对 于 描述 浓度 效应 关系 的 最 大 优点 是 , 当 药 物 
浓度 渐 趋 增高 时 ,效应 逐渐 接近 最 大 值 , 即 能 够 预测 最 大 效应 ;同时 在 整个 浓度 范 
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围 内 呈 连 续 性 。S 形 曲线 也 符合 在 整个 浓度 范围 内 采集 的 实际 生物 数据 ,浓度 为 
零 时 可 以 预测 零 效应 。 

对 于 不 同 的 给 药 过 程 ,药物 动力 学 还 有 许多 数学 模型 ,如 药物 经 皮 吸收 数学 模 
型 ,可 以 较 好 地 反映 药物 渗透 系数 与 药物 结构 的 关系 。 在 药物 释放 研究 中 ,常常 采 
用 Logistic 模型 或 改进 的 Logistic 模型 进行 描述 。 研 究 药 物 效 应 和 浓度 的 关系 
时 ,采用 药物 效应 室 模 型 等 。 


第 六 节 ”群体 遗传 学 模型 


在 遗传 学 上 ,人 们 经 常 研 究 数量 性 状 , 即 在 世代 遗传 中 呈 连 续 性 变异 的 性 状 的 
规律 性 。 主 要 研究 生物 个 体 之 间 数 量 上 和 程度 上 的 差异 ,而 不 是 质量 上 和 种 类 上 
的 差异 。 数 量 性 状 的 遗传 基础 是 微 效 多 基因 学 说 (Poly - genes) , 它 认为 数量 性 状 
受 许多 彼此 独立 的 基因 共同 作用 ,每 个 基因 的 表现 效果 微小 ,但 其 遗传 方式 符合 孟 
德尔 遗传 规律 。 

常用 的 研究 方法 有 统计 学 的 方法 ,还 有 数学 模型 的 方法 。 数 量 遗 传 学 包括 统 
计 遗 传 学 和 群体 遗传 学 两 部 分 ,统计 遗传 学 主要 研究 数量 性 状 的 遗传 和 变异 ,研究 
各 遗传 参数 之 间 的 关系 及 其 估算 方法 ,采用 的 方法 都 是 概率 和 统计 学 的 基本 方法 。 
在 统计 遗传 学 中 利用 检验 方法 进行 生物 样本 的 频率 检验 ,如 检验 某 群体 遗传 是 否 
符合 3 : 1 的 备 德尔 遗传 规律 ,还 可 以 进行 样本 参数 的 统计 分 析 。 群 体 遗 传 学 则 研 
究 群 体内 基因 的 传递 规律 , 阑 述 生物 进化 的 机 制 ,遗传 多 态 现象 的 维持 。 

利用 计算 机 则 可 进行 群体 遗传 的 计算 和 遗传 过 程 的 模拟 ,如 下 面 通 过 计算 说 
明 复 等 位 基因 的 遗传 平衡 。 

设 在 群体 中 的 一 个 基因 座 上 ”个 复 等 位 基因 A,，A:，…，A, 的 频率 分 别 为 
六， 加 ，…， 加 ,在 达到 遗传 平衡 时 ,等 位 基因 频率 与 基因 型 频率 的 关系 可 表示 为 
如 下 的 数学 形式 ， 


[Sp.c45 = Dp? AA +2 3 [ p> pip;(AiA,) | 
名 各 气 EA 


又 如 考虑 选择 对 遗传 基因 频率 的 影响 。 

[ 例 13-6] 和 群体 遗传 实例 。 假 设 某 性 状 是 由 一 对 等 位 基因 (A -a) 所 决定 ， 
并 且 AA, Aa, ae 的 基因 型 频率 分 别 为 U，T，S, 并 进一步 假定 : 

(1) 上 述 频率 对 于 肉 雄 两 性 都 是 相同 的 , 峻 雄 个 体 的 交配 是 随机 的 。 

(2) 无 迁移 .突变 .遗传 变化 的 发 生 。 
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如 果 选 择 对 隐 性 纯 合 体 不 利 , 设 aa 的 适合 度 为 W, 则 选择 后 的 子 代 a 基因 
频率 : 
-0.5T+WS 
~ U+T+WS 
设 户 = 1 一 gq, 其 后 代 各 个 基因 型 频率 
U=p, T=2pg. S= gq 
若 过 程 重复 G 次 , 则 表示 经 过 了 G 代 的 选择 ,从 而 可 以 求 得 各 世代 的 AA、 
Aa、aa 的 基因 型 频率 以 及 p,q 的 值 。 


现 有 一 起 始 群体 ,其 遗传 组 成 为 
基因 型 AA Aa aa 


频率 0.1 0.2 0.7 
车 选择 对 aa 不 利 ,aa 的 适合 度 为 0. 8, 试 给 出 该 群体 在 30 代 内 基因 型 及 基因 
频率 的 变化 情况 。 
可 以 得 到 30 代 后 基因 频率 变化 为 
基因 型 AA Aa aa 


频率 0.6361 0.3229 0.0410 

特别 是 可 用 计算 机 模拟 遗传 漂 变 对 群体 基因 频率 影响 过 程 。 如 果 采 用 常规 的 
生物 实验 方法 ,一 般 要 经 过 几 十 代 甚至 几 百 代 才能 得 到 某 个 实验 结果 ,有 时 由 于 实 
验 条 件 的 限制 根本 无 法 进行 实验 。 而 采用 计算 机 根据 其 遗传 漂 变 的 数学 特征 进行 
模拟 , 则 过 程 非常 简便 ,可 大 大 提高 研究 的 效率 。 

其 原理 是 利用 计算 机 所 提供 的 随机 函数 模拟 自然 界 中 的 各 种 随机 现象 ,结合 
生物 规律 ,产生 模拟 数据 ,模拟 生命 科学 中 的 随机 现象 。 所 谓 的 随机 函数 其 数值 介 
于 0 一 1 之 间 , 每 次 产生 的 随机 数 均匀 分 布 ,但 是 各 不 相同 。 

在 群体 很 小 时 ,等 位 基因 频率 会 发 生 随机 波动 的 现象 , 即 产生 遗传 漂 变 。 这 种 
波动 会 导致 某 基因 座 的 基因 固定 ( 即 基因 频率 为 1) 或 丢失 ( 即 基 因 频 率 为 0) 。 遗 
传 漂 变 来 源 于 两 个 随机 过 程 的 发 生 , 即 亲 代 个 体 基因 型 的 确定 和 子 代 基 因 型 的 确 
定 。 因 此 可 以 用 计算 机 随机 函数 来 表示 遗传 漂 变 现象 。 

学 者 张 立 岭 建立 了 基因 频率 动态 特征 的 随机 过 程 模型 。 生 物 群 体 在 进化 过 程 
中 ,大 群体 是 指 足 以 使 随机 漂 变 效应 微弱 到 忽略 不 计 的 孟 德尔 群体 。 计 算 机 模拟 
实验 表明 , 当 没有 选择 压力 时 ,大 小 为 10° 的 群体 可 以 忽略 随机 漂 变 ;如果 有 选择 
压力 , 则 “大 群体 ”的 含量 还 可 以 进一步 缩小 。 家 畜 群 体 除 个 别 品种 外 ,都 不 算 太 
大 ,即使 群体 大 小 在 10* 量 级 以 上 的 品种 ,也 由 于 在 实验 上 是 以 小 群体 ,特别 是 峻 
雄 数量 不 等 ,雌雄 比例 极 不 平衡 的 情况 下 进行 繁殖 。 所 以 ,无 论 是 与 人 工 选择 或 自 
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然 选 择 有 关 的 基因 ,还 是 与 这 些 选择 无 关 的 基因 ,都 广泛 存在 着 基因 频率 的 随机 遗 
传 漂 变 现象 。 此 外 ,群体 大 小 的 不 稳定 和 选择 强度 的 起 伏 不 定 、 环 境 因 素 的 偶然 变 
化 等 ,也 会 导致 或 加 剧 随机 遗传 漂 变 的 效应 。 张 立 岭 采 用 了 多 种 模型 ,包括 离散 状 
态 的 Markov 链 和 连续 状态 的 Markov 过 程 ,扩散 方程 Kolmogolov 前 向 方程 和 后 
向 方程 , Wright - Fisher 模型 ,研究 了 基因 频率 动态 特征 的 随机 过 程 模型 。 并 用 模 
型 所 得 到 的 结果 ,分 析 和 推断 群体 遗传 特征 的 成 因 和 预测 群体 中 某 些 位 点 上 等 位 
基因 的 变化 趋势 (内 蒙古 农业 大 学 学 报 []],2001,22(3))。 














第 七 节 ”生命 科学 的 其 他 典型 数学 模型 


一 、 生 物 反应 动力 学 模型 


酶 促 反 应 动力 学 是 生物 化 学 中 最 常见 的 数学 模型 , 它 研 究 酶 促 反 应 的 速度 ,以 
及 影响 此 速度 的 各 种 因素 的 科学 ,其 中 米 氏 方程 (Michael, Menten 提出 ) 反 映 的 是 
底 物 浓度 对 酶 促 反 应 速度 的 影响 。 米 氏 方程 的 推导 过 程 如 下 ,假定 反应 为 


已 +S 包 ES 如 P 十 下 
kz 
ES 的 形成 速度 为 
ES] = (CE]— CES] x[S] 
根据 [ES] 的 动态 平衡 ， 
ki([E]—[LES]) X [LS] = kLES]+k [LES] 
kt+k _([E] 一 [ES]) xI[S] 
k LES]J 





令 K, 一 


则 产物 生成 速度 : 


和 
v= 二 如 [ES] 二 名 上 中 


酶 反应 中 的 其 他 动力 学 方程 基本 上 都 是 米 氏 方程 的 修正 式 ,如 底 物 抑制 模型 、 
产物 抑制 模型 .多 底 物 模型 等 。 


二 、 神 经 传导 模型 
神经 传导 模型 中 最 著名 的 模型 是 Hodgkin - Huxley 方程 , 它 将 电 物 理学 观点 
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和 数学 方法 相 结合 研究 神经 学 中 的 神经 生理 过 程 ,该 电 神 经 生理 数学 模型 能 成 功 
地 拟 合 实验 数据 ,得 到 了 实验 的 验证 。 它 将 神经 细胞 的 兴奋 过 程 以 电流 的 传播 形 
式 来 表示 ,因为 细胞 兴奋 过 程 和 脉冲 电流 较为 相似 ,表现 为 一 个 一 个 的 间断 性 起 
伏 。 方 程 的 最 终 形式 为 偏 微 分 方程 。 模 型 的 建立 不 外 平 根据 电流 平衡 的 原则 和 电 
学 的 特性 。 

其 他 信息 传导 过 程 可 以 根据 过 程 特点 建立 特定 的 方程 。 简 单 的 信息 传递 可 抓 
住 过 程 的 某 个 特点 ,简化 过 程 而 建立 模型 ,如 动物 的 嗅觉 信息 传递 过 程 模型 。 

[ 例 13-7] 信息 素 是 由 动物 释放 的 一 类 “气味 ”化 学 物质 ,借助 扩散 作用 在 
空气 中 散布 ,用 于 动物 个 体 之 间 的 信息 传递 ,其 传递 过 程 可 以 定量 。 如 蚂蚁 对 其 警 
戒 物 质 的 觉察 过 程 的 定量 研究 。Bossert 和 Wilson(1963 年 ) 将 蚂蚁 和 警戒 物质 放 
在 一 根 管子 的 两 端 ,测定 了 蚂蚁 的 位 置 及 其 觉察 到 警戒 物质 的 时 间 ,数据 如 表 13 - 
5 所 示 。 

表 13-5 蚂蚁 位 置 与 觉察 到 物质 的 时 间 


试验 号 | 距离 /em 时 间 /s | 试验 号 | 距离 /em | 时 间 /s 











根据 信息 素 的 扩散 传导 特点 ,可 以 推导 出 蚂蚁 与 警戒 物质 的 距离 和 其 觉察 到 
警戒 物质 的 时 间 之 间 的 关系 为 


logt = logz 一 
式 中 :DD 为 扩散 系数 ,7 为 模型 参数 。 
可 以 求 得 D ~ 0. 4 cm?/s。 
三 、 乘 法 原理 


对 于 基因 的 配对 ,由 于 DNA,，RNA 和 产物 的 多 样 性 ,可 用 乘法 原理 简单 说 明 
它们 的 随机 匹配 。 

[乘法 原理 ] 假 定 某 事 可 以 以 n, 种 方式 出 现 ,而 不 管 此 事 以 何 种 形式 发 展 , 另 
一 种 事 可 以 nz 种 方式 出 现 , 那 么 出 现 两 者 的 方式 总 数 为 nm，ns, 即 为 


N= 第 一 种 方式 数 X 第 二 种 方式 数 


"0 ~ 


将 乘法 原理 用 于 说 明细 胞 或 人 的 减 数 分 裂 ,就 可 以 帮助 我 们 理解 生物 体 的 众多 选 
择 可 能 性 ,生物 体 之 间 的 千差万别 ,生物 界 的 多 姿 多 彩 。 

总 之 ,生命 科学 中 的 数学 模型 还 有 许多 许多 ,可 分 别 应 用 于 各 种 不 同 的 情况 ， 
如 DNA 模型 (DNA 匹配 .DNA 与 蛋白 质 氨 基 酸 的 表达 ) ,生物 大 分 子 结构 模型 ( 蛋 
白质 结构 模型 .药物 结构 模型 ) 以 及 其 他 生命 科学 中 的 计算 机 图 形 学 等 。 而 随 着 生 
命 科学 的 研究 和 探索 的 深入 ,新 的 数学 模型 又 等 待 着 人 们 去 研究 和 探讨 。 


本 章 学 习 要 点 : 

(1) 学 习 数 学 模型 ,不 断 扩 充 知识 面 。 

(2) 学 会 在 实践 中 发 现 和 提出 问题 ,搜集 资料 ,组 建 模型 ,解决 问题 。 
(3) 学 习 数学 模型 的 综合 ,归纳 ,抽象 和 化 简 。 

(4) 学 习 使 用 数学 模型 软件 ,会 设计 程序 。 


i 


第 十 四 章 ”数学 模型 的 求解 与 线性 回归 


第 一 节 ”数学 模型 的 求解 和 最 小 二 乘法 原理 


一 、 简 单数 据 模 型 的 处 理 方法 


数学 模型 的 求解 有 许多 方法 ,对 于 简单 的 数学 模型 如 两 个 变量 之 间 的 关系 ,经 
常用 图 解 或 图 示 的 方法 处 理 实验 数据 ,了 解 其 曲线 变化 的 趋势 和 估计 线性 模型 的 
实验 参数 。 一 般 尽 可 能 地 将 方程 线性 化 ,然后 求解 方程 , 如 确定 方程 的 斜率 和 截 
距 , 从 而 进一步 求解 数据 模型 的 参数 。 对 研究 多 个 变量 或 更 复杂 的 关系 , 则 需 采用 
回归 的 方法 求解 。 


二 、 回 归 分 析 


回归 分 析 是 研究 随机 现象 中 变量 之 间 关 系 的 一 种 统计 方法 ,通过 大 量 的 实验 
数据 ,从 中 得 到 隐藏 在 随机 性 后 面 的 统计 规律 ,而 这 种 统计 规律 称 为 变量 之 间 的 回 
归 关 系 。 它 主要 解决 以 下 间 题 :确定 几 个 特定 的 变量 之 间 是 否 存 在 相互 关系 ,如 
果 存 在 , 找 出 它们 之 间 关 系 的 合适 数学 表达 式 。@@ 根 据 某 些 变量 值 ,预测 或 控制 另 
一 个 变量 的 取 值 ,并 可 知道 该 预测 或 控制 可 达到 的 精确 度 。@ 进 行 因子 分 析 , 如 对 
于 共同 影响 一 个 变量 的 许多 因子 中 ,分 析 哪 些 是 重要 因子 ,哪些 是 次 要 因子 ,以 及 
因子 之 间 的 相互 关系 。@ 进 行 实验 方案 的 设计 ,根据 实验 目的 和 实验 结果 的 要 求 ， 
并 考虑 回归 分 析 对 实验 数据 的 要 求 ,主动 设计 实验 方案 ,尽量 以 少 的 实验 次 数 , 获 
得 最 多 的 实验 信息 。 同 时 希望 所 得 到 的 实验 数据 能 够 便于 回归 分 析 和 数据 处 理 ， 
具有 较 好 的 统计 性 质 。 回 归 分 析 法 中 最 常用 的 数学 方法 是 最 小 二 乘法 。 


三 、 最 小 二 乘法 原理 


处 理 实验 数据 的 拟 合 时 ,最 小 二 乘法 是 最 有 用 和 最 常用 的 方法 之 一 ,是 一 种 非 
常 有 用 的 数学 工具 。 最 小 二 乘法 的 基本 原理 是 :在 具有 同一 精确 度 的 许多 测定 数 
据 中 求 其 最 优 值 , 即 各 个 测定 值 的 残 差 的 平方 和 为 最 小 时 的 值 。 它 是 在 实验 误差 
呈正 态 分 布 的 许多 实验 数据 中 求解 ,所 拟 合 的 曲线 的 趋势 可 以 不 受 实验 随机 误差 
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的 影响 而 出 现 局 部 的 波动 。 如 果 各 个 数据 的 精度 不 同 , 则 需 对 数据 作 加 权 处 理 。 
最 小 二 乘法 的 数学 描述 为 


Q= > (一 xz) = min 


式 中 :yw、xu 分 别 是 实验 值 和 计算 值 。 

如 在 m 个 未 知 参数 的 估计 中 , 拟 合 函数 关系 的 数据 为 个, n 宇 m。 由 于 每 次 
测量 均 有 误差 存在 ,该 问题 即 是 从 n 个 带 有 误差 的 数据 (或 方程 式 ) 中 ,求解 m 个 
未 知 参数 ,采用 最 小 二 乘法 可 较 好 地 解决 这 类 问题 。 

利用 最 小 二 乘法 求 得 的 近似 方程 或 函数 y = f(z)，, 它 和 数值 方法 中 插值 求解 
中 的 近似 方程 y = P,(z) 或 曲线 不 同 。 插 值 方程 中 各 个 已 知 节点 上 函数 的 计算 值 
和 函数 给 定 值 (实验 值 ) 一 致 ,而 回归 拟 合 方程 函数 的 计算 值 和 实验 值 并 不 一 致 。 
插值 方程 经 常会 出 现 振荡 ,特别 是 在 高 阶 方程 时 , 它 不 能 反映 实验 值 的 变化 规律 ， 
而 拟 合 方 程 能 够 反应 实验 值 的 变化 规律 和 变动 趋势 ,可 以 平滑 或 去 除 任 何 时 间 系 
列 上 的 不 规则 变动 。 

用 于 回归 分 析 、 最 小 二 乘法 计算 的 软件 有 SAS、MATLAB、EXCEL 等 ,其 中 
以 SAS 最 为 著名 ,适用 的 范围 最 广 , 但 一 般 采用 MATLAB、EXCEL 的 统计 工具 
箱 就 能 解决 生命 科学 实验 中 的 常见 问题 ,能 进行 线性 模型 . 非 线性 模型 的 回归 和 方 
差分 析 。 





第 二 节 ”实验 数据 的 一 元 线性 回归 


回归 分 析 方法 一 般 是 以 最 小 二 乘法 为 基础 的 一 种 处 理 变量 相关 关系 的 数理 统 
计 方 法 ,依靠 实验 误差 的 随机 性 找 出 变量 之 间 的 统计 规律 性 。 在 回归 分 析 中 ,最 简 
单 的 是 只 有 一 个 自 变量 和 一 个 因 变 量 的 两 参数 关系 。 


一 、 一 元 线性 回归 
一 元 线性 回归 的 出 发 点 是 假设 两 个 变量 的 测量 值 wm，z，i 一 1，2，…, m) 之 
间 的 关系 符合 数学 模型 
y=B+B :xte 一 1，2， 7) 


式 中 :e, 表示 其 他 随机 因素 对 y 的 综合 影响 ,一般 均 假定 它们 是 一 组 相互 独立 , 且 
服从 同一 正 态 分 布 N(0, c) 的 随机 变量 。 对 于 z, 一 般 只 讨论 它 是 可 以 精确 测量 或 
严格 控制 的 变量 。 在 这 些 条 件 下 , 因 变 量 > 将 是 服从 正 态 分 布 N(B 十 Bl * xi, o) 


一 自 t 一 


的 随机 变量 。 方 程式 中 的 参数 8B, B 可 以 从 已 知 的 有 限 次 测量 值 y;，x; 中 ,用 最 
小 二 乘法 求 得 其 估计 值 b。， 证 。 如 , bi 又 称 为 方程 的 回归 系数 。 
最 小 二 乘法 处 理 的 原理 建立 在 数据 的 残 差 基础 上 ,由 回归 系数 构成 的 回归 方 
程 为 
ui =both .ri 
在 每 一 个 zx 处 所 确定 的 回归 值 w ,与 实际 观察 值 y; 之 差 , 称 之 为 余 差 或 残 差 
Yi = yb bx 


回归 时 要 求 它 的 平方 和 为 最 小 , 即 根据 余 差 平方 和 或 剩余 平方 和 为 最 小 的 原则 : 














Qio, b) = > (一 02 一 >) (y 一 各 一 和 x) = min 
i=1 i=] 


由 yi, zi(i 二 1,，2,*…,n) 的 测量 数据 求 出 回归 系数 b。, 6b, 的 值 。 因 此 用 最 
小 二 乘法 得 到 的 回归 方程 和 测量 值 y;，x; 在 误差 平方 和 的 意义 上 偏差 最 小 。 既 然 
Qlbo，,b1) 是 bo， bi 的 非 负 二 次 函数 ,所 以 Q 的 最 小 值 一 定 存在 ,并 可 由 微分 学 中 
的 极 值 原理 知道 b， b, 应 是 下 列 方程 的 解 : 


3Q 2x Dy hh.)=0 
i=l 


ab 
望 一 一 2 X Dba “zz =0 
上 面 的 方程 组 为 正规 方程 ,或 法 方程 , 它 也 可 简化 地 写成 以 下 形式 : 
Dy—u)=0 
由 正规 方程 可 以 解 得 


bo 一 了 一 入 XI 
>)(Crzoyi) 一 ln。 (Dr) Dy) 
Dr — /ne (> zi) 


式 中 :了 二 1/n。 D2)yi, 工 二 1/n，》)z;，》) 为 对 i 从 1 到 nn 求 和 的 简化 符号 。 为 


了 书写 的 方便 ,习惯 上 采用 以 下 计算 符号 : 





b 





“i = 


la = Dra) = > xz 一 1/m。 (Dr) 

二 2 7) = 2 一 1/m Dy) 

ly = Dz)(y;—7) Dr 1/m 。 2 。 2y, 
故 可 将 系数 b 的 表达 式 写 成 


b = Ly /ls 


又 车 把 式 bo 一 了 一 锯 .世代 人 原 回归 方程 ,可 得 到 回归 方程 的 男 一 种 形式 : 











u—y=b(r;— I) 

由 此 可 知 线性 回归 方程 通过 所 有 测量 值 的 重心 (z, 了) , 即 全 部 测量 值 的 x; 和 y; 的 
算术 平均 值 ,该 重心 也 就 是 回归 方程 的 重心 。 

二 、 一 元 线性 回归 方程 的 显著 性 检验 和 方差 分 析 

在 求解 一 元 线性 回归 方程 系数 时 ,并 不 需要 事先 要 求 两 个 变量 之 间 存 在 着 某 
种 线性 关系 ,就 回归 方法 而 言 , 即 使 对 于 一 组 本 身 没 有 线性 关系 的 数据 ,也 能 求 出 
一 条 回归 直线 ,只 是 没有 实际 意义 。 因 此 ,在 利用 最 小 二 乘法 求 取 线性 回归 方程 
后 ,必须 对 所 得 到 的 方程 进行 判别 ,确定 该 回归 方程 有 没有 实际 意义 ,是 否 与 实验 
数据 相符 , 即 用 一 定 的 方法 判断 所 关联 的 两 个 变量 之 间 的 相关 程度 究竟 有 多 大 。 

1. 相关 系数 的 检验 

在 线性 回归 方程 中 ,系数 六 是 直线 的 斜率 ,其 大 小 程度 取决 于 计算 值 x 随 z 
变化 的 程度 。 如 果 与 x 完全 没有 关系 , 即 为 零 相关 , 则 x 不随 xz 的 变化 而 变化 。 
此 时 回归 方程 的 斜率 为 0, 即 可 得 

和 一 lo/ =0 
而 反 过 来 如 果 把 y 作为 自 变量 ,x 作为 因 变 量 ,可 以 得 到 另 一 个 回归 方程 ; 
v= btbiey 
式 中 :回归 值 v 是 x 的 估计 值 。 和 上 述 一 样 ,由 于 4 与 x 完全 没有 关系 ,同样 可 知 
并 的 估计 值 v 也 与 y 无 关 。 所 以 
b= Ls/ly 一 0 
将 上 述 两 个 式 子 合并 ,就 可 以 知道 当 z 和 >y 完全 不 相关 时 必定 有 


= 


全 
反之 , 当 所 有 的 测量 点 都 落 在 回归 曲线 上 时 , 则 有 y = u, x 二 v。 上 述 两 式 可 
分 别 改写 为 
yy 一 名 十 入 。 工 
工 一 区 十 的 。 3 
由 于 它们 也 是 同一 条 直线 的 方程 ,所 以 其 斜率 之 间 的 关系 为 b1 = 1/61，, 或 者 


CA 
b=1 
基于 以 上 两 种 特殊 情况 ,定义 一 个 参数 相关 系数 ,用 以 判断 两 个 变量 间 线 性 
相关 的 程度 ,其 定义 为 








NE 
ls I 


根据 前 面 的 分 析 , 可 以 知道 + 具有 以 下 性 质 : 

(1)r 是 b 和 及 的 几何 平均 值 , 即 忆 二 by，。6b1 。r 的 取 值 介 于 两 个 回归 系数 bb 
和 之 间 ,r 值 大 小 表示 两 个 变量 之 间 的 线性 相关 程度 。 

(2) 当 r 二 0 时 ,b 一 外 = 0, 即 两 个 变量 之 间 没有 线性 关系 , 称 为 线性 无 关 。 

(3) 当 r 一 士 1 时 , 思 "从 一 1, 即 所 有 的 测量 点 都 落 在 回归 曲线 上 ,两 个 变量 之 间 
存在 着 完全 相关 的 关系 。 其 中 当 = 十 1 时 , 称 为 正 相关 , 即 因 变 量 的 值 随 自 变量 的 
值 增 大 而 增 大 ; 当 = 一 1 时 , 称 为 负 相 关 , 即 因 变量 的 值 随 自 变量 的 值 增 大 而 减 小 。 

(4) 当 0 一 |r | 过 1 时 ,两 个 变量 之 间 存 在 着 一 定 的 线性 相关 程度 。 其 中 的 
绝对 值 越 大 ,表示 线性 相关 的 程度 越 紧 密 。 

事实 上 ,该 相关 系数 和 概率 中 以 协 方差 定义 的 相关 系数 无 论 在 形式 上 还 是 在 
实质 上 、 内 容 上 都 是 一 致 的 。 将 相关 系数 和 斜率 的 表示 式 代 入 残 差 平方 和 Q, 得 


Q= 对 [一 7 十 名/ (z—z)F 
可 展开 为 














L A E 2 
Q= 刀 一 2X 闻 ls 十 这 一 妃 一 疡 (1 i ) 


即 可 表示 为 Q= (1—7) .Ll,。 
可 见 Q 和 rr 之 间 存 在 着 相互 关系 , 当 7 的 绝对 值 越 接 近 于 1 时 ,Q 值 越 接近 于 
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0; 反 之 , 当 7 的 绝对 值 越 接 近 于 0 时 ,Q 值 和 /,, 就 越 接近 。 

在 实际 过 程 中 ,对 测量 值 作 线性 回归 时 ,所 得 到 的 7 值 一 般 都 不 为 0。 因 此 ,为 
研究 回归 系数 的 变量 相关 性 ,必须 有 一 种 方法 来 判断 所 得 到 的 线性 回归 方程 是 否 
有 效 ,这 就 是 说 必须 对 相关 系数 进行 显著 性 检验 。 

相关 系数 的 检验 可 用 临界 相关 系数 进行 判别 。 临 界 相 关系 数 ro。 是 自由 度 / 
和 显著 性 水 平 a 的 函数 (参见 相关 系数 表 )。 在 这 里 ,自由 度 f 等 于 测量 点 数 减 
去 2。 临界 相关 系数 ro 的 含义 是 在 所 选 定 的 显著 性 水 平 a 下 ,所 得 到 的 线性 回归 
方程 具有 意义 必须 具备 的 最 低 相 关系 数 。 

[ 例 14-1] 采用 苯酚 -硫酸 法 测定 糖 含量 ,得 到 如 表 14 - 1 所 示 数 据 : 


表 14-1 采用 苯酚 一 硫酸 法 测定 糖 的 含量 









葡萄 糖 浓度 /Cyg/ml) 
OD490 





研究 葡萄 糖 浓度 和 OPD 值 的 线性 关系 ,可 以 得 到 以 下 回归 方程 ; 


Clglucose) = 100. 88 X OD 一 0. 546 


方程 的 相关 系数 r= 二 0.9998, 而 mm(5, 0. 01) 二 0. 874 5, 因此 相关 系数 远大 于 临界 
相关 系数 ,说 明 两 者 的 线性 关系 很 好 ,如 图 14- 1 所 示 。 


OD490 
2 
x 





0 20 40 60 80 
Clglucose, hg/ml) 


图 14- 1 葡萄 糖 标准 曲线 


2. 一 元 线性 回归 方程 的 方差 检验 
根据 前 面 的 分 析 , 每 个 测量 值 的 变 差 y; 一 3 都 可 以 分 解 成 两 部 分 : 


入 一 了 一 (一同 ) 十 (一 了 ) 


式 中 :前 一 项 为 残 差 ; 后 一 项 为 y 的 估计 值 和 平均 值 之 差 , 即 y; 的 变异 有 两 部 分 引 
起 :QDxz, 的 变异 引起 ,@ 其 他 未 知 影响 因素 引起 残 差 s 。 对 于 N 个 测量 值 的 总 变 


二 人 


异 情况 ,可 用 测量 值 与 其 算术 平均 值 的 偏差 的 平方 和 表示 , 称 之 为 离 差 平方 和 ,并 
将 其 按 变异 原因 进行 分 解 。 
定义 离 差 平方 和 为 
ly = Dy;—D)? 











ly = Dy oD = DEy mw) + —DF 
= Dy + mB) +2 Ly —u) Cu —D)] 





根据 线性 回归 的 特性 , 即 为 正规 方程 ,可 以 证 明 交 互 项 2)[(y 一 w)(w 一 习 ] 一 
0, 因而 可 得 离 差 平方 和 ， : 
ly = Dy + DD) 
或 者 用 下 式 表示 : 
Qz=Q+G 
式 中 : 
Qe = Do—D: = Dbot br,—b— bz)’ 
一 pe D(z;—7)? = Rels= /ls = "ls 
Qk 称 为 回归 平方 和 , 它 反 映 了 由 于 自 变 量 X 的 变化 而 引起 的 变异 ,可 以 用 回归 线 
性 方程 估计 因 变 量 y 的 变异 : 
Q= Dy —u): = Ly, — QR 
= 人 及 /一 各 一 bl = (zly — Ls)/ls 


QQ 称 为 残 差 或 余 差 平方 和 , 它 反映 了 因 各 种 没有 加 以 控制 的 随机 因素 所 引起 的 变异 。 
Qr 和 QQ 的 相对 大 小 说 明了 线性 回归 效果 的 优 劣 。Qs 在 Qz 中 所 占 的 比例 越 


大 ,线性 回归 的 效果 越 好 ,线性 回归 的 相关 系数 越 大 。 因 为 Qe/Q; 一 a/ = 











-名 二 六 ,这 说 明 回 归 平方 和 和 相关 系数 之 间 存 在 着 一 定 的 关系 。 


ls 
线性 回归 方程 的 检验 也 可 以 用 下 统计 量 检验 。 由 上 述 三 个 平方 和 及 其 相对 应 
的 三 个 自由 度 fs，fr，f, 可 以 计算 出 三 个 相应 的 标准 差 , 即 
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次 关 ( 总 变 差 ) 标 准 差 ， 一 /全 = Ai 
回归 标准 差 “== VI VE 


剩余 标准 差 : 二 V9 m /3 


引入 统计 量 F，F 为 回归 平方 和 方差 和 残 差 平方 和 方差 之 比 , F 二 号， 它 的 自 
由 度 分 别 为 1 和 (n 一 2)。 得 到 下 的 表达 式 : 





r=- gs 

根据 给 定 的 显著 性 水 平 a, 可 得 临界 值 已 .oa.,->, 和 该 统计 量 下 值 作 比 较 , 可 
以 判断 回归 方程 的 有 效 性 。 假 如 以 回归 效果 不 显著 作为 假设 检验 中 的 假设 H。, 即 
假设 H,:y~z 没有 线性 关系 ,b = 0。 如果 对 于 计算 所 得 到 的 下 值 , P(F > 
下 .2 ) 三 a, 即 该 事件 为 小 概率 事件 ,可 拒绝 假设 。 于 是 认为 6 取 0, 即 回归 的 
线性 效果 显著 。 反 之 如 下 一 FF,.0. ,2，， 则 接受 假设 ,认为 回归 效果 不 显著 。 

3. 插值 多 项 式 和 回归 方程 的 区 别 

对 于 给 定 的 实验 数据 (zx;，y,) , 求 插值 多 项 式 。 首 先 ,由 于 该 插值 多 项 式 在 每 
一 个 节点 上 都 和 实验 数据 (x;，y;) 相 符 , 即 e? = 0。 然而 在 实验 中 ,每 个 测量 数据 本 
身 就 有 误差 ,插值 曲线 通过 数据 点 (x;，y,) ,会 使 曲线 保留 原 有 的 测量 误差 。 其 次 ， 
当 实 验 数据 很 多 时 ,如 采用 多 项 式 插值 得 到 的 是 高 次 多 项 式 , 计 算 较 为 麻烦 ,而 且 
效果 较 差 。 另 外 ,插值 多 项 式 不 能 反映 出 实验 数据 的 本 来 变化 趋势 

而 回归 曲线 不 同 , 虽 然 > ef 闯 0, 该 曲线 能 够 直接 反映 实验 数据 的 本 来 变化 
趋势 ,能 够 从 实验 数据 中 找 出 规律 。 特 别 是 当 实 验 点 多 的 时 候 , 可 利用 数据 的 统计 
规律 ,消除 或 减少 随机 误差 ,能 有 效 地 表达 变量 之 间 的 函数 关系 ,并 可 利用 回归 方 
程 对 实验 过 程 进行 预测 和 控制 。 另 外 , 它 的 计算 比较 简单 。 


第 三 节 多 元 线性 回归 


一 、 二 元 线性 回归 
一 元 线性 回归 中 仅仅 讨论 了 两 个 变量 之 间 的 关系 ,但 是 实际 过 程 中 影响 实验 
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结果 的 变量 常常 不 止 一 个 ,对 于 多 个 变量 之 间 的 回归 称 为 多 元 回归 ,如 果 变 量 之 间 
的 关系 属于 线性 关系 的 , 即 为 多 元 线性 回归 。 

多 元 线性 回归 分 析 的 原理 和 过 程 与 一 元 线性 回归 基本 一 致 ,只 是 回归 参数 的 
计算 和 各 个 影响 因子 的 检验 繁复 。 以 其 中 最 简单 的 二 元 线性 回归 为 例 , 说 明 多 元 
线性 回归 分 析 的 原理 和 过 程 。 

在 二 元 线性 回归 中 ,影响 y 值 的 因素 有 xz! 和 x; 两 个 变量 ,可 测 得 n 组 实验 点 
[yis zu Zz.(i 二 1，"…, nn)], 类 似 一 元 线性 回归 ,可 推导 得 到 回归 方程 : 


下 一 名 十 bz 十 如 zz 一 1，…，7) 
或 和 一 加 十 bz 十 加 zz 十 6( 一 1，…，m) 


模型 方程 : ?一 名 十 bz 十 如 zz 
式 中 :b 为 常数 ;by 、bz 分 别 为 ?对 zx 和 zz 的 回归 系数 ,分 别 表示 另 一 自 变 量 保 
持 不 变 时 ,该 自 变量 变化 对 因 变 量 数 值 变化 的 影响 大 小 。 

根据 最 小 二 乘法 原理 , 取 


Q= DLy:— (bo tbr 十 名 zz) 了 
iml 


当 Q 取 最 小 值 时 ,Q 关于 回归 参数 的 偏 导数 为 0。 对 Q 关于 三 个 回归 参数 求 
偏 导 , 并 令 其 为 零 , 即 3Q/ 3b; = 0,j = 0, 1, 2, 转化 可 得 
Wo tb Drutb Da = Dy, 
bo Drith Dt tb Dirs = Druy: 
bo Dr tb Drirs tb Ds = Dry; 
如 用 和 矩阵 形式 表示 , 则 为 


az D2 mira zy 
Dr Zruza DE zay， 


求解 该 方程 组 , 即 可 得 到 其 模型 参数 ,并 得 到 二 元 线性 回归 方程 。 
如 果 将 方程 换 一 种 形式 表示 , 设 


3= /nD)y, T= /nD ri, we = /nD) ze 
由 于 二 了 一 Zl 一 bs xz， 代入 最 小 残 差 平方 和 Q: 


n > Zi 2 2 bo ”3 Yi 


2 











Q be ui)? BL DD) —bi(xy—) 一 名 (zz — 2) 
将 Q@ 关 于 两 个 模型 参数 b, ,bs 求 导 ,得 方程 组 : 
BD rs a)bt Dr —z) ra 一天)2 = 2 (mi 一 五 )(y 一 了 
| Fb + >) (zz — 2)b = > (za 一 2)(y 一 了 
为 了 简化 方程, 令 
l= Dm) = Dt 1nd zi) 
la = Dr —z) = Do—1/n( Dr) 
lz = la = Dr —Zz) rs —z) = Drirs—1/n( Dr) za) 
y= Di)y—D) = Driyi—l/n dn) yi) 
lay = Dx — za) yi —D) = Drayi—1/n( dD) zr) dy) 
于 是 方程 转化 为 








~ 


























nbi tlizbz = 1 
| nb Ttz0z 或 由 3 
Lab + Labz = Lay 
可 解 得 
hb 一 Lyla — Lalis 
如 lz — Lh 
b= Lu 一 La 
lnlz 一生 


并 可 得 到 bo = 了 一 bz! 一 ba 工 ,。 

二 、 多 元 线性 回归 

从 二 元 线性 回归 可 依 此 类 推 到 多 元 线性 回归 ,多 元 线性 回归 过 程 可 用 下 面 的 
步骤 说 明 。 设 多 元 线性 回归 方程 的 数学 模型 为 

3 一 所 十 Br 十 太 zr 十 … 十 Bozn 

该 公式 即 是 表示 因 变 量 y 与 m 个 自 变量 zx ，zz，…，<zw 之 间 存 在 的 线性 函数 

通过 实验 数据 回归 模型 参数 的 估计 值 ,已 知 组 实验 值 (y;, zi;， zz ，…，, zm) 
的 关系 为 
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入 一 下 十 6 一 加 十 让 Di 十 如 Zai 十 …… 十 pzmi 十 EGG 一 1，2，…，7) 


式 中 :y 为 实验 值 ,wu; 为 计算 值 ,e; 为 残 差 。 为 求解 (m 十 1) 模 型 参数 bo， bi， bb， 
…， bm ,代入 nn 组 实验 数据 , 即 得 个 方程 : 


1 =bothizn+brat tharm + el 
yz = bo hz horzz 十 … 十 bozm2 十 ez 











Yn = bo hii borzn 十 … 十 porzm 十 er 
根据 最 小 二 乘法 原理 ,要 求 回归 时 的 残 差 平方 和 最 小 , 即 要 求 


Q= De = min 
i=l 

用 和 矩阵 形式 表示 方程 组 ,形式 为 Y = 十 E, 式 中 ， 
bo 
Yl 1 zn Xa ml & b 
1 

1 

Y= 2 ,X= 12 人 Tm2 “前 二 E2 二 项 
1 De Za … Tom En 2 


Q= Se 一 > Re 
i=1 iml 


Q= D0) = Dy bo br br — brm)! = min 
i=1 i=1 











根据 极 值 原理 ,分 别 求 Q 关于 未 知 值 六 的 偏 导数 ,并 令 偏 导数 的 值 为 零 , 于 是 
得 到 m 十 1 个 方程 式 的 正规 方程 组 ,求解 该 方程 组 可 得 模型 参数 bo，b， 
加 

事实 上 ,和 一 元 线性 回归 一 样 ,Q 是 6; 的 非 负 二 次 式 , 所 以 一 定 存在 Q 的 极 小 
值 。 对 Q 求 二 次 偏 导 : 


aQ@ pv) 
Ey 2 2 uw)=0 
如 一 一 2 Dz =0 


j=1,2,*,m 
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aQ@_- ar yov 
Do: 一 5 220% 已 


a 220% bo — bix1i — baxz; 








bnrm)] = 2n>0 
23:Q 


i 
5 36 2 ui)xi] 


[2 Dy bb br bm ) zi] = 2 D>0 
于 i=1] i=l1 
Pm 二 军训 








由 于 二 阶 偏 导数 都 大 于 0, 故 所 得 的 模型 参数 bo。, by ，b,，…, 如 一 定 能 满足 Q 
为 极 小 值 。 令 A = XX: 





1 1 
1 rn za ml 
Tu Xl 1 
1 zi Za 
A= |za 2 Tzn , 


dl 
m Tm Tm 

因为 Y==Xb 十 E, 式 中 的 E 是 N 维 的 随机 变量 , 它 的 分 量 是 相互 独立 的 。 所 以 
求解 常数 的 正规 方程 组 可 以 转化 为 


(XTX)b 一 XYY， 或 4b=B 
b=(X'X) "XY=A™! X'Y= A™'B 
该 式 即 是 模型 参数 的 最 小 二 乘 估 计 计 算式 。 
代入 实验 数据 , 则 为 





n Dz Dz Dz 
i=] i=1 i=] 

Dx; Dz DJ zurs Dzizm 

i=1 i=1 i=1 i=1 

A=X'X= | n » a 
Dra Drirs Dr Dr 

i=1 i=1 i=1 i=1 

bp Tw be 如 i 六 2 

[和 分 ed | 





本 光一 


Dy 
i=] 
了 1 1 I 1 < 
Thi 
Bl Tu Tl Zl yz 这 Wy 
B= | B, |=XY= |r zz Zan|| 2 | 二 
5 Taiy 
: >” 
Bn lt Tend | ys 
Dry 
L, 一 J 








从 而 通过 解 (m 十 1) 元 正规 方程 组 ,可 求解 (m 十 1) 个 未 知 的 模型 参数 。 
类 似 于 一 元 回归 和 二 元 回归 ,多 元 回归 也 可 以 采用 另 一 种 简化 的 形式 。 因 为 


bo = Fb — bo Tz" — bn Tm 








Q= Dy mb — br — br —" — bnrm)’ 
i=l 








SD DD—b(zi—Z) 一 名 (za — 2) 一 光一 加 (zwmi — Zn) 
iel 
将 上 式 分 别 关 于 b(j = 1 ~ m) 求 偏 导数 ,并 令 其 为 零 ,同样 可 以 得 到 一 个 正 
规 方程 组 : 


Unb t+ hbo 十 … 十 Lo = lly 
Labi tt lzbz tt loambm = lzy 





bbi + lnzbz + e+ lnmbm = Lny 

式 中 : 

B= Di) = Dl/n( Dx) 

la = = Di) rz) = Drirs—1l/n( dr) Dr) 

ly = DD ri Ey —D) = Dziyi— /nD zr) (Dy) 

ji k=1,2, 0 m 

解 该 正规 方程 组 即 可 得 到 模型 参数 , 即 线性 回归 方程 中 的 系数 。 实 际 上 两 种 
方程 的 形式 是 一 致 的 。 如 将 bo 二 了 一 bi i 一 bz 一 … 一 bm 工 m 代入 线性 回归 方程 ， 
方程 转 为 
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多 王 了 十 负 (zi 一 五 ) 十 庆 (mz 一 素 ) 十 … 十 如 (ze — En) te (i=1,2,.,n) 
相应 的 系数 矩阵 转化 为 


一 一 Te 
= 1 xzlz 一 元 rz— ZX Ey 
= 
1 xm—T Xm—Z Tmn — Tm 
n 0 0 0 
0 hh la | 5 
A=¥X=|0 le ln wa -[’ | 
: | 0 
0 ba Us di 
Ab=B,B=[Oy hy ly ln] 
2 ri/n 0 
c= -[% ;| 
综 上 所 述 ,只 要 求 得 工 , 即 可 求 得 C, C 还 能 用 于 模型 参数 的 显著 性 检验 。 
bi ly 
b; | 
如 果 b 不 含 6o, 此 时 b 二 =@B=I"| : 
bm L 


以 上 是 采用 最 小 二 乘法 进行 线性 回归 的 过 程 。 最 小 二 乘法 是 最 常用 的 回归 方 
法 ,利用 最 小 二 乘法 所 求 出 的 回归 系数 估计 值 具有 如 下 的 统计 特性 ;无 偏 性 ; 
@ 互 不 相关 性 ;@ 等 精度 ;@ 服 从 正 态 分 布 。 但 是 利用 最 小 二 乘法 求解 回归 系数 的 
方法 并 不 是 在 任何 情况 下 都 是 最 佳 的 。 除 最 小 二 乘法 外 ,还 有 其 他 的 参数 估计 方 
法 。 因 为 许多 非 线性 问题 ,其 目标 函数 不 是 平方 和 形式 ,例如 最 小 绝对 剩余 误差 
法 ,是 利用 》 | e |= min 的 条 件 来 回归 模型 参数 ;最 大 残 差 法 是 以 max | 6; |= 
min 为 条 件 来 回归 模型 参数 ;最 小 广义 极 差 法 的 目标 函数 为 max | s | 一 min | 6; | 二 
min, 以 此 来 回归 模型 参数 等 等 。 由 于 不 同 实验 情况 所 涉及 的 具体 范围 很 广 ,在 此 
基础 上 ,根据 不 同 要 求 以 不 同 的 目标 函数 进行 方程 参数 的 求解 。 这 也 可 称 为 最 优 
化 方法 ,就 是 找 出 使 其 目标 函数 达到 最 优化 的 有 关 因 子 的 参数 值 。 
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三 、 多 元 回归 方程 的 显著 性 检验 和 方差 分 析 


1. 多 元 回归 方程 的 方差 分 析 

多 元 线性 回归 方程 的 显著 性 检验 和 一 元 线性 回归 相似 ,同样 可 以 用 方差 检验 
或 相关 系数 检验 ,检验 回归 模型 是 否 和 实验 数据 相符 。 但 是 它 和 一 元 线性 回归 相 
比 要 复杂 ,因为 对 多 元 线性 回归 不 仅 要 检验 方程 总 体 的 有 效 性 ,还 要 检验 每 一 个 自 
变量 在 回归 方程 中 的 作用 是 否 显 著 。 和 一 元 线性 回归 一 样 ,多 元 线性 回归 方程 y 
的 总 的 离 差 平方 和 Qz 仍然 可 以 分 为 两 个 部 分 , 即 回归 平方 和 和 残 差 平 方 和 : 


ly = >) (yi 一 有 :一 Dy) uD) 
或 者 用 下 式 表示 : 











Qs = Q+ Qe 
式 中 :Q 为 残 差 平方 和 , 它 反映 了 因 各 种 没有 加 以 控制 的 随机 因素 所 引起 的 变异 ; 
Qe 为 回归 平方 和 ,反映 了 所 有 的 m 个 自 变量 对 因 变 量 y 的 变 差 的 总 影响 。 
可 以 用 回归 线性 方程 系数 估计 因 变 量 y 的 变异 , 按 下 式 计 算 
Qe = D9 = Do 


该 回归 平方 和 的 自由 度 fr 一 闷 。 残 差 平方 和 (或 称 为 剩余 平方 和 ) 是 除了 这 些 自 变 
量 之 外 的 其 他 随机 因素 对 y 的 影响 , 它 可 由 下 式 计算 : 











Q= 居 一 四 = 2 yi—w)? = Ly Zbls 
二 


该 残 差 平 方 和 的 自由 度 了 一 fz 一 fe 二 n 一 m 一 1。 

Qe 和 QQ 的 相对 大 小 说 明了 线性 回归 效果 的 优 劣 。Qe 在 总 的 离 差 平方 和 中 所 
占 的 比例 越 大 ,说 明 y 的 变异 中 由 各 个 自 变量 的 变化 引起 所 占 的 比例 越 大 ,回归 方 
程 中 的 自 变量 对 y 的 相关 性 越 大 。 相 对 而 言 , 其 他 随机 因素 所 引起 的 y 的 变异 就 
越 小 ,回归 方程 的 回归 效果 就 好 。 

首先 对 回归 方程 作 总 体 方差 检验 。 引 入 统计 量 下 ,下 为 回归 平方 和 方差 和 残 
差 平 方 和 方差 之 比 , 下 一 李 ， 它 的 自由 度 分 别 为 m 和 (n 一 m 一 1)。 


根据 给 定 的 显著 性 水 平 a, 可 得 临界 值 F. co. ,-m-v ,和 统计 量 下 值 作 比 较 , 可 
以 判断 回归 方程 的 有 效 性 。 假 如 以 回归 效果 不 显著 作为 检验 中 的 假设 有 H,, 即 假设 
Ho:y~z 没有 线性 关系 ,也 就 是 5 = 0。 如 果 对 于 计算 所 得 到 的 下 值 , 下 二 


-226- 


下. 4m. -m1， 即 可 拒绝 假设 。 于 是 认为 6 关 0, 即 回归 方程 中 模型 系数 5b; 中 至 少 有 
一 个 不 为 零 ,回归 的 线性 效果 显著 。 反 之 如 下 过 Fn, mb， 则 接受 假设 ,认为 
2 一 0, 即 回归 方程 中 模型 系数 5; 均 为 零 ,认为 回归 效果 不 显著 。 

该 方差 分 析 检 验 过 程 用 于 有 A 个 自 变量 的 多 元 线性 回归 , 它 的 具体 参数 计算 
如 表 14- 2 所 示 。 














表 14-2 方差 分 析 

来 源 平方 和 自由 度 均 方差 下 值 
回归 Qe = DD? 

残 差 & = Duy 
Qi=/, = D-DD: 


2. 各 个 自 变量 在 多 元 线性 回归 中 的 作用 

回归 方程 要 求 Q 的 数值 小 ,Q 在 总 的 离 差 平方 和 中 所 占 的 比例 大 ,这 其 中 有 
两 个 含义 , 即 希望 :DQ 的 数值 小 ,si 符合 正 态 分 布 ;@ 回 归 方程 中 应 排除 对 实验 结 
果 影 响 不 太 显著 的 变量 。 前 者 利用 回归 方程 的 总 体 显著 性 检验 进行 判别 ,后 者 利 
用 回归 方程 中 各 个 回归 系数 的 显著 性 检验 进行 判别 。 根 据 给 定 的 显著 性 水 平 a, 可 
得 变量 x 的 偏 回归 系数 的 下 临界 值 F。, 和 该 值 作 比较 ,从 而 判断 该 自 变 量 对 y 的 
影响 大 小 。 考 虑 到 各 个 自 变量 对 y 的 影响 ,对 于 具体 的 变量 z; 的 显著 性 检验 , 引 
出 了 偏 回归 平方 和 ,其 定义 为 








一 Qe/k 
Q/(n—k—1) 











QQ 一 Qi 
式 中 :Qe 为 方程 的 回归 平方 和 ,QR 为 新 的 回归 方程 的 回归 平方 和 。 该 新 方程 去 除 
了 zz; 项 , 即 原 回 归 方 程 为 
yy 二 娩 十 i 十 byTz 十 十 Bj 十 十 bm 
而 新 回归 方程 为 
一 站 十 寻 厂 十 好 了 十 委 十 有 rz 六 十 如 ii 十 和 十 下 zw 


引入 统计 量 FF 一 名 《大 ,其 中 对 于 一 个 自 变量 时 ，f, = 1, 则 有 


F= Q, 
Q/(n—m—1) 
根据 给 定 的 显著 性 水 平 ,可 得 临界 值 F。. 6 ,mn-» ,和 该 下 统计 量 作 比较 ,可 
以 判断 该 自 变量 对 y 的 影响 是 否 显著 。 
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为 了 偏 回归 平方 和 计算 的 便利 , 记 
C=A!= (XX)! 


C 矩阵 中 各 个 元 素 可 写 为 
[ce ce ca Cm | 
Ic cu ca Cml 
C= | ce cz Cm 
Com Clm Cam °° Com 
C 为 对 称 和 矩阵。 
由 于 b=A'B=CB 


bi = cotBo 十 ckBl 十 caB 十 … 十 ceBn。 (k=0,1,2,.,m) 
可 以 证 明 回 归 方 程 中 去 除 z 项 后 ,新 的 回归 系数 和 原 回归 系数 之 间 的 关系 为 


by =6— db, UD 
式 中 :cy ，cx 均 为 C 的 元 素 。 
由 于 QR = 2)bly, QR = >) bi 1s, 于 是 
名 


j=], jl 
Q = Qe — QR = b/c 
或 者 偏 回归 平方 和 以 通 式 表示 : 
Qi = /ey 
取 偏 回归 的 下 统计 量 


be Re 
Fo = Gh 


根据 给 定 的 显著 性 水 平 a, 可 以 得 到 F。, 0,,-m-vb。 当 让 ,; > F。 时 ,表示 该 变 
量 的 回归 方差 不 可 忽视 ,该 项 自 变量 z 不 能 剔除 ;反之 , 当 Fe; 二 F 时 ,表示 该 变 
量 的 回归 方差 不 显著 ,假设 6 = 0 成立, 该 项 自 变量 x 可 以 剔除 。 一 般 来 说 , 那 一 
个 自 变量 的 偏 回 归 检 验 下 值 较 大 , 那 一 个 自 变量 对 y 的 影响 就 较为 显著 。 

其 他 的 统计 检验 方法 还 有 t 检验、 相关 系数 检验 等 。 

3. 相关 系数 及 其 显著 性 检验 

1) 相关 系数 

线性 回归 方程 除了 作 方 差 检 验 外 ,还 可 以 进行 相关 系数 的 显著 性 检验 。 相 关 
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系数 是 定量 地 描述 两 个 变量 (x;，y ) 之 间 线 性 关系 密切 程度 的 一 个 指标 。 根 据 前 
面 的 推导 ,可 用 下 式 来 计算 : 
> (ri 一 z)(y 一 愉 


AM > iz) Dy — 73) 


Ss Py/n 
日 (i=1,2,.,n) 
2 = Dri/n 9 
该 相关 系数 是 一 个 统计 量 ,是 从 ”个 实验 数据 样本 计算 得 到 。 相 关系 数 可 以 延伸 
到 各 个 变量 之 间 的 线性 关系 的 表示 。 
相关 系数 还 有 另 一 种 表达 形式 : 
> (ui 一 了 )2 


r= = 
2 一 32 Qs 





即 相关 系数 的 平方 是 回归 平方 和 在 总 的 离 差 平方 和 中 的 所 占 比 例 。 或 用 残 差 平方 
和 来 表示 , 残 差 平 方 和 的 大 小 反映 了 回归 的 直线 与 所 有 实验 点 在 整体 上 接近 的 
程度 : 
Du 3)? DC — yy 
es 1 
2 一 刀 ? 2 0 一 习 ? Qs 
显然 , 7 莹 1, 则 相关 系数 的 取 值 是 0 过 |r | 之 1。 相关 系数 的 意义 也 和 前 面 的 推导 
一 致 。 

在 计算 相关 系数 时 ,上 述 的 相关 系数 r 是 样本 的 相关 系数 ,实验 上 是 总 体 相关 


系数 的 估计 值 。 因 为 两 个 变量 x 与 y 之 间 的 线性 相关 性 ,是 由 总 体 相关 系数 p 决 
定 的 ,从 前 面 介绍 的 概率 论 可 知 ,p 的 定义 是 














2 


_ ECzy) 一 ECzDECy) 
Gry 
这 从 根本 上 说 明了 相关 系数 和 变量 之 间 关联 的 联系 。 相 关系 数 r 有 其 自己 的 概 
率 分 布 ,因此 两 个 变量 z 与 y 之 间 的 线性 相关 性 可 用 相关 系数 的 大 小 来 进行 检验 。 
当 |r | 和 xr。 时 ,在 显著 性 水 平 a 下 ,可 否定 与 y 之 间 的 线性 相关 性 。 
当 |r | 二 ri。 时 ,在 显著 性 水 平 a 下 ,可 认为 与 y 之 间 是 线性 相关 的 。 
在 一 元 线性 回归 中 自由 度 了 一 ”一 2。 
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当 模 型 为 非 线 性 模型 时 ,经 常 通过 线性 化 转换 ,转变 为 线性 方程 ,这 时 可 同样 
采用 相关 系数 检验 。 但 是 ,实际 上 这 时 检验 的 并 不 是 变量 z 与 》 之 间 的 线性 相关 
性 ,而 是 转换 后 的 新 的 变量 X 与 了 之 间 的 线性 相关 性 。 所 以 ,为 了 区 别 对 待 ,有 时 
也 称 这 类 的 相关 系数 为 相关 指数 ( 见 表 14- 3)。 

表 14-3 相关 系数 临界 值 




















2 
f yy f 
0.05 0.01 0.05 0.01 
1 0.99692 | 0.999877 17 0.455 5 0.5751 
2 0.95000 | 0.99000 18 0.4438 0.5614 
3 0.8783 0.958 73 19 0.4329 0.5487 
4 0.8114 0.917 20 20 0.4227 0.5368 
5 0.7545 0.8745 25 0. 380 9 0.4869 
6 0.7067 0.8343 30 0. 349 4 0.4487 
7 0. 666 4 0.7977 35 0. 324 6 0.4182 
8 0.6319 0.7646 40 0.304 4 0.3932 
9 0.6021 0.7348 45 0.2875 0.3726 
10 0.5760 0.7079 50 0.2732 0.3546 
11 0.5529 0.6835 60 0.2500 0.3248 
12 0.5324 0.6614 70 0.2319 0.3017 
13 0.5139 0.6411 80 0.2172 0.2830 
14 0.4973 0.6226 90 0.2050 0.2673 
15 0.482 1 0.6055 100 0.1946 0.2540 
16 0.468 3 0.5897 

















2) 复 相关 系数 与 偏 相关 系数 
在 多 元 回归 方程 中 ,y 与 xi，zr，…，zm 之 间 的 线性 相关 程度 ,也 可 以 用 相关 
系数 类 似 的 形式 来 表示 。 但 在 多 元 回归 分 析 中 称 为 复 相关 系数 尺 , 其 定义 为 


DG —3)? DG — yi) 

1 二 到 1 一 Q 
2 C9 一 习 ? 2 (一 习 ? Qz 
上 式 的 意义 也 很 明确 ,表示 回归 平方 和 在 总 的 离 差 平方 和 中 所 占 的 比例 。 对 于 复 
相关 系数 R 的 显著 性 检验 ,实质 上 是 对 整个 回归 方程 的 显著 性 检验 ,其 自由 度 三 一 


二 二 


R? 
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但 是 在 多 变量 的 情况 下 ,变量 与 变量 之 间 的 相互 关系 是 很 复杂 的 ,因为 任意 的 
两 个 变量 之 间 可 能 存在 着 相互 关系 ,而 在 动态 过 程 中 ,所 有 的 变量 又 都 在 变化 。 如 
果 要 真实 地 反映 两 个 变量 之 间 的 相互 关系 ,必须 在 去 除 其 他 变量 的 影响 情况 下 计 
算 它 们 的 相关 系数 。 这 种 相关 系数 称 为 偏 相关 系数 , 即 在 固定 其 他 变量 ,将 它们 作 
为 常数 的 情况 下 进行 计算 而 得 到 的 相关 系数 。 2 

例如 ,有 三 个 变量 ZI， xs， zs, 在 x1，Xs 去 除了 xs 的 影响 后 ,它们 之 间 的 相关 
系数 riz,: 称 为 zx，zz 对 zs 的 偏 相关 系数 。 若 x!，xs，xs 之 间 的 简单 相关 系数 
rw， ra，z1s 已 知 ,那么 相关 系数 maz.: 可 用 下 式 计算 : 


ra 3 一 rz 一 Narz3 
Vi—h Vi —rs 
> (zs —z) (ry 一 五 ) 








式 中 : rs 





M (zs 一 元 )2 > ry —)’ 


如 果 有 4 个 变量 zi ，zz ，za，z4, 在 ri，zz 去 除了 zs，z4 的 影响 后 ,它们 之 间 
的 相关 系数 riz, 3 称 为 zx，zs 对 xs 和 xz 的 偏 相关 系数 。 和 以 上 的 计算 式 相 似 , 相 
关系 数 mz.% 可 用 下 式 计 算 : 


M2,3 一 74,3724,3 _. 


1 2. 34 一 
VIR Via 


由 于 变量 之 间 的 关系 非常 复杂 , 偏 相 关系 数 与 简单 相关 系数 在 数值 上 可 能 有 
较 大 差异 ,甚至 有 时 会 出 现 符号 相反 的 情况 。 不 过 ,只 有 偏 相关 系数 才 真正 反映 两 
个 变量 的 本 质 联系 ,而 两 个 简单 相关 系数 则 可 能 由 于 其 他 因素 的 影响 ,仅仅 反映 的 
是 表面 的 \ 非 本 质 的 联系 。 

在 多 元 线性 回归 中 ,回归 系数 六 是 在 去 除了 其 他 变量 的 影响 后 ,变量 xz; 对 y 
的 影响 。 因 此 ,回归 系数 与 偏 相 关系 数 之 间 是 有 密切 联系 的 ,如 两 者 的 符号 一 致 。 
而 4 与 变量 x; 对 y 的 简单 相关 系数 ”并 没有 本 质 上 的 联系 。 

在 多 元 回归 的 显著 性 检验 中 ,下 检验 和 相关 系数 检验 本 质 上 是 一 致 的 ,两 者 只 
要 检验 一 种 即 可 。 然 而 在 自 变量 较 多 的 情况 下 , 偏 相关 系数 的 计算 相当 复杂 , 故 在 
实际 计算 时 应 用 较 少 。 许 多 情况 下 ,采用 下 检验 进行 处 理 。 

4. 多 元 回归 实例 

[ 例 14-2] 研究 杉木 的 生长 模型 时 ,选取 了 产地 (A)、 树 龄 (B)、 郁 闭 度 (C)、 
坡度 (D) , 坡 位 (E) , 坡 向 (F)6 个 因子 ,通过 正 交 实 验 确定 其 对 树 高 ( 互 ) 和 车 积 量 
(MD 的 影响 ,从 而 确定 其 生长 模型 ( 谢 惠 琴 等 )。 将 这 些 因 子 数据 化 后 得 到 表 14-4 
所 示 的 数据 : 


le 


表 14-4 杉木 的 树 高 .蓄积 量 与 6 个 因子 的 关系 








试验 号 | 产地 A | 树龄 B | 郁 闭 度 C| 坡度 D | 坡 位 E | 坡 向 F | H/m | M/m’ 
1 26. 25 8 0.5 | 16.3 | 16 203 5.3 1.6 
2 26. 25 15. 2 0.7 28.6 49 113 11.0 13.7 
3 26. 25 22.5 0.8 36.5 82 23 12.7 13.6 
4 26.75 7 0.6 27 49 23 6.1 3.6 
5 26.75 15.5 0.7 30 82 203 13.9 16.8 
6 26.75 25 0.8 17.6 16 113 14.6 21.8 
7 27.25 8 0.7 19 82 23 6.6 5.1 
8 | 27.25 15 0.9 28 ] 16 203 14.1 18.6 
9 27. 25 20.3 0.6 31.8 49 113 12.8 7.7 

10 26. 25 8.3 0.8 31 49 203 7.8 6.6 
11 26. 25 15.7 0.5 22 82 113 9.3 4.6 
12 26. 25 19.5 0.7 28 16 23 11.8 10.5 
13 26.75 6 0.7 32.5 16 113 4.6 2.2 
14 26.75 12.3 0.8 18.8 49 23 10.4 9.0 
15 26.75 | 20 0.6 27 82 203 12. 2 11.1 
16 27. 25 9 0.9 29.5 82 113 7.8 7.9 
17 27. 25 12 0.6 34 16 23 10.5 6.4 
18 27. 25 21 0.7 19.3 49 203 13.8 13.9 

















试 将 以 上 数据 进行 多 元 线性 回归 ,并 进行 检验 ( 取 a 一 0. 05)。 





由 以 上 数据 ,可 知 树 高 的 态 回归 方程 为 


H= 一 37.2840 十 1.342 3A 十 0.473 4B 十 4.608 6C 十 


0.041 8D 一 0.004 0E+0.005 9F 
其 回归 系数 为 0. 934 0, 下 检验 值 为 12. 528 9 > Fo.os.66.1 二 3. 09, 因此 回归 效果 


显著 。 
蓄积 量 M 的 回归 方程 为 : 


M= 一 26. 325 8 十 0.3697A 十 0.656 1B 十 24.215 5C 一 


0.063 6D— 0. 005 0E+0.014 3F 
其 回归 系数 为 0. 902 2, 下 检验 值 为 8. 023 4 > Fo.os, .in 二 3.09, 因此 回归 效果 


显著 。 








但 经 过 对 自 变 量 的 偏 回归 检验 ( 取 a 二 0.05), 互 仅 与 B 相关 ,得 到 
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H=3.3355+0.4812 B 
下 一 56. 23 > Fu oa. 一 4. 54, 因 此 回归 效果 显著 。 
M 也 仅 与 B\C 相关 ,得 到 
M=—16. 4598 十 0. 6697 B 十 23. 5436 C 

下 一 25. 027 二 Fu os,ous) 一 4. 54, 因 此 回归 效果 显著 。 

两 个 方程 的 总 体 下 值 均 有 提高 。 

[ 例 14-3] 黄 小 阳 等 研究 了 野生 向 体重 和 养殖 浆 体 重 与 其 形态 指标 之 间 存 
在 的 多 元 线性 关系 ,分 析 了 鉴 体 重 与 背 甲 长 . 腹 甲 长 等 13 个 形态 参数 之 间 的 关系 
( 见 表 14 - 5) ,分别 得 到 了 回归 方程 (生命 科学 研究 [J],4(2) ,2000) 。 


表 14-5 17 只 野生 警 的 形态 测量 








项 目 测量 值 /cm 项 目 测量 值 /cm 
背 甲 长 (Xi) 12. 90 士 12. 32 头 长 (Xs) 4. 35 士 4. 29 
背 甲 宽 (X:) 10. 79 士 9. 49 眼色 (Xs) 0. 69 士 0. 36 
腹 甲 长 (Xs) 9. 92 士 10. 04 眼 间 距 (Xio) 0. 48 士 0. 44 
腹 甲 宽 (X,) 5. 44 士 5. 07 吻 长 (Xi) 0. 55 土 0. 33 
体高 (Xs) 3. 50 土 2.77 口 裂 (Xi2) 1.64 土 1.22 
头 高 (Xs) 2. 36 士 2. 44 尾 长 (Xia) 3. 10 士 3. 30 
头 宽 (X;) 2.02 士 1.76 











分 析 表 明 , 对 野生 监 体重 影响 均 达 到 显著 水 平 的 形态 指标 的 最 优 多 元 回归 方 
程 为 
Y = 8 850. 51 +6 796. 1X 一 1010.91Xs +1464.72Xs— 
8 296. 64X。 一 3 142. 09X12 


方程 的 下 二 194. 58, 下 > Fu ou， 表明 线性 回归 有 效 , 在 所 测 13 个 形态 指 
标 中 , 背 甲 长 ,体高 , 头 长 . 眼 径 ` 口 裂 为 影响 野生 攻 体 重 的 显著 因素 。 

控 温 条 件 下 快速 生长 鉴 的 体重 对 背 甲 长 等 13 项 形态 指标 的 最 优 多 元 回归 方 
程 为 

Y =— 97. 46 + 38. 99X, 一 30. 26Xs — 29. 34Xs 十 140. 83Xio — 30. 42X'1s 


方程 的 下 二 118. 62, 下 > Fu cin， 各 测量 指标 对 体重 线性 回归 极其 显著 ,说 
明 在 商品 向 生 长 阶段 , 腹 甲 宽 、 体 高 . 头 长 、 眼 间距 、 尾 长 对 体重 影响 显著 ( 见 
表 14-6)。 








之 于 一 


表 14-6 控 温 养殖 条 件 下 42 只 1 龄 鳌 的 形态 测量 








项 目 测量 值 /cm 项 目 测量 值 /cm 
背 甲 长 (Xi ) 6. 29 士 1. 65 头 长 (Xs) 2. 66 士 0. 53 
背 甲 宽 (X,) 5. 56 士 1. 25 眼 径 (Xs) 0. 46 士 0. 08 
腹 甲 长 (X;) 5.07 士 1. 21 眼 间距 (Xio) 0. 24 士 0. 06 
腹 甲 宽 (X,) 2. 68 士 0. 65 吻 长 (Xi ) 0. 36 士 0. 10 
体高 (X;) 2.11 士 0.46 口 裂 (Xi2) 0. 95 士 0. 20 
头 高 (Xe ) 1. 12 士 0. 20 尾 长 (X13) 0. 94 士 0. 50 
头 宽 (X;) 1. 31 士 0. 24 








通过 对 两 个 多 元 线性 回归 方程 的 比较 ,可 以 知道 对 野生 向 体重 影响 显著 的 
5 个 因素 中 , 头 部 指标 有 3 个 ,位 、 身 干部 指标 2 个 ,尾部 指标 无 ,说 明 野生 条 件 下 头 
的 生长 对 乏 的 生长 影响 最 大 ,可 以 用 头 部 综合 指标 作为 选 育种 的 主要 依据 ,然后 再 
考虑 驱 干 部 指标 。 控 温 条 件 下 快速 生长 向 对 体重 有 显著 影响 的 5 个 因素 为 : 头 部 
指标 2 个 ,躯干 部 指标 2 个 ,尾部 指标 1 个 。 这 与 野生 鉴 有 差异 ,也 有 相同 之 处 ,而 
差异 主要 是 由 生活 环境 的 差异 引起 的 。 体 高 , 头 长 是 共同 影响 因素 ,说 明 在 不 同 条 
件 下 体高 . 头 长 都 会 对 体重 产生 影响 ,这 主要 是 由 决定 次 生长 的 内 部 因素 所 决 
定 的 。 

[ 例 14-4] 王 继 和 等 通过 对 金冠 .新 红星 ,毛里 斯 3 种 苹果 品种 的 光合 特性 
日 变化 ,季节 变化 的 研究 ,结果 表明 各 种 苹果 的 光合 速率 与 其 蒸腾 强度 . 胞 间 CO 
浓度 及 环境 因子 光照 强度 ,水 分 气 缺 等 之 间 线性 相关 ,并 得 到 了 多 元 线性 回归 方程 
(西北 植物 学 报 [J],2000,20(5)) 。 


四 、 多 元 线性 回归 与 实验 数据 平滑 


在 动态 的 数据 测量 中 ,对 于 实验 点 ,重复 测量 次 数 有 限 , 测 量 误差 不 明 。 为 区 
别 异 常 实验 数据 ,减少 测量 误差 ,根据 多 元 回归 方程 ,不 仅 可 利用 全 部 数据 的 变化 
趋势 来 消除 数据 中 测量 误差 带 来 的 干扰 ,还 可 利用 局 部 数据 的 变化 趋势 来 消除 数 
据 中 测量 误差 的 影响 ,如 图 14 - 2 所 示 。 数 据 平滑 尤其 被 用 于 无 法 利用 多 次 重复 
测量 来 得 到 其 平均 值 的 情况 和 当 y; 随 zx; 有 徒然 变化 的 那些 测量 段 , 如 寻找 峰 位 、 
峰值 或 拐点 等 数据 。 

对 实验 数据 进行 修 匀 ,做 平滑 处 理 , 即 构建 一 个 M 阶 多 项 式 : 


y= f(z; aty az，…，an) 一 ao 十 ai 并 十 azz2 十 … 十 am 


根据 最 小 二 乘法 对 已 知 实验 数据 中 的 n 组 数据 进行 拟 合 ,利用 拟 合 公式 的 计 
算 结 果 代 蔡 该 点 的 实验 测定 值 。 常 用 的 有 五 点 二 次 平滑 (n 二 5, M = 2), 五 点 三 
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图 14-2 实验 数据 平滑 示意 


次 平滑 (= 5，M = 3) 两 种 方法 ,此 时 多 项 式 的 M 次 导数 为 常数 。 数 据 平滑 和 插 
值 计算 类 似 , 一 般 点 数 n 越 多 ,次 数 M 越 高 ,随机 误差 的 补偿 性 越 好 ,但 须 防止 出 
现 曲 线 振荡 的 现象 。 

1. 五 点 二 次 平滑 

假设 实验 数据 排列 紧密 ,而 且 节点 之 间 是 等 距 的 ,对 于 2n 个 区 间 , 共 有 2n 十 1 
个 节点 ,各 个 节点 之 间 的 步 长 为 h。 选 取 五 个 临近 的 实验 点 , 设 其 横 坐 标 分 别 为 
一 2， 一 1， 0,，1，2, 相 对 应 的 纵 坐标 分 别 为 y-2，y-!，y。，》1，ys。 选 择 二 次 曲线 
方程 y = ao 十 a1z 十 azx? 拟 合 数据 ,根据 最 小 二 乘法 原理 求解 方程 的 参数 ,要 求 


Q= (Oo 一 加 一 min 


作 多 元 回归 后 ,可 得 
ao = 1/35(— 3y > 十 12y 十 17yo 十 12y 一 3yz) 
| 一 1]/10( 一 2y-: 一 y- 十 为 十 2yz) 
az = 1]/14(2y-: 一 y — 2 — Yt+2y2) 
分 别 代入 z 的 横 坐 标 值 , 即 得 到 五 点 二 次 平滑 公式 ,其 中 五 点 中 的 中 心 y 值 就 是 
ao, 即 Jo 一 1/35( 一 3y: 十 12y-, 十 17yo 十 12y, 一 3ys), 其 他 各 点 公式 分 别 为 
也 2: 一 1/35(31y-* 十 9y- 一 3 一 5 十 3yz) 
Tl 1/35(9y-z 十 13y 十 12yo 十 6y 一 5yz) 
驴 一 1/35( 一 5y :十 6y- 十 12% 十 13y 十 9yz) 
yz = 1/35(3y-2 一 5y-: 一 3 十 9y + 31y2) 
对 于 所 有 区 间 上 的 节点 计算 ,和 分 段 插值 函数 处 理 类 似 , 应 尽 可 能 采用 中 心平 














~ 


滑 公 式 计算 ,以 减少 误差 , 除 无 法 使 用 中 心平 滑 公式 的 最 左边 两 个 点 和 最 右边 两 个 
点 之 外 。 从 而 根据 平滑 公式 可 得 到 所 有 平滑 计算 值 。 

2. 五 点 三 次 平滑 

类 似 五 点 二 次 平滑 ,选择 三 次 曲线 方程 y 二 ao 十 x 十 azx? 十 asz?。 

拟 合 数据 ,根据 最 小 二 乘法 原理 求解 方程 的 参数 , 然后 得 到 五 点 三 次 平滑 
公式 : 








yz = 1/70(69y s+ 4y 1 — 6y dy —y2) 
51 = 1/35(2y ;2 +27y 十 12y 一 8y 二 2y2) 
7 = 1/35(— 3yz 十 12y- 十 17y 十 12y — 3y2) 
1 = 1/35(2y :一 8y- 12yo 十 27y 十 2ye) 
De 一 1/70( 一 :十 47- — 6y 十 42 十 69yz) 


该 公式 在 节点 计算 上 的 应 用 和 五 点 二 次 平滑 公式 一 样 。 
对 于 不 等 距 节 点 的 实验 数据 的 动态 平滑 ,也 可 按照 多 元 线性 回归 原理 作 不 等 
距 平 滑 。 平 滑 公式 的 选择 同样 应 尽 可 能 中 心平 滑 , 以 减少 计算 误差 。 


第 四 节 逐步 回归 法 


在 多 元 线性 回归 中 ,假如 变量 较 多 ,变量 之 间 也 可 能 不 是 相互 独立 的 ,那么 如 
何 从 众多 的 变量 中 挑选 出 合适 的 变量 ,如 何 建立 最 优 的 回归 方程 ,如 何 从 各 因子 中 
选择 显著 性 的 影响 因子 ,剔除 不 显著 的 因子 ,这 些 都 是 逐步 回归 分 析 的 内 容 。 

最 优 的 回归 方程 应 包含 两 个 内 容 :Q@ 最 后 的 回归 方程 中 应 该 包括 尽 可 能 多 的 
因素 ,尤其 应 包括 任何 对 y 有 显著 影响 的 变量 。 而 从 统计 意义 来 说 ,回归 方程 中 变 
量 越 多 ,回归 平方 和 就 愈 大 ,而 剩余 ( 残 差 ) 平 方 和 相应 就 小 ,回归 效果 就 好 。@@ 回 
归 方 程 中 应 包含 尽 可 能 少 的 变量 ,以 减少 回归 计算 和 使 用 上 的 困难 。 因 为 方程 中 
包含 有 对 y 不 起 作用 或 作用 很 小 的 变量 , 残 差 平 方 和 并 不 会 减少 太 多 。 相 反 , 由 于 
试验 的 自由 度 减少 , 残 差 的 方差 反而 有 增加 的 可 能 ,从 而 影响 回归 方程 的 回归 效 
果 。 所 以 最 优 的 回归 方程 应 包含 所 有 对 y 影响 显著 的 变量 ,而 不 包含 任何 影响 不 
显著 的 因素 。 

最 优 回归 方程 的 选择 方法 有 以 下 四 种 : 

(1) 从 所 有 可 能 的 因子 组 合 的 回归 方程 中 挑选 出 最 优 方程 ,这 类 方法 对 于 方 
程 中 有 多 个 自 变量 的 时 候 , 显 然 不 大 可 能 ,如 在 四 个 可 能 自 变 量 的 组 合 回归 方程 中 
挑选 ,所 有 的 回归 方程 有 十 GG 十 日 十 Ct 二 15 个 ,因此 必须 对 这 15 个 方程 的 系 
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数 均 进 行 回归 ,并 逐个 比较 方程 的 显著 性 和 方差 ,进行 挑选 而 得 到 其 最 优 方 程 。 如 
自 变量 为 10 个 , 则 需 研究 的 方程 共有 > ,Ci = 2" 一 1 二 1023 个 。 

(2) 从 包含 全 部 因子 的 回归 方程 中 逐次 剔除 不 显著 的 因子 的 方法 , 称 为 退 后 
消去 法 (BACKWARD) , 即 采 用 前 一 节 中 的 多 元 线性 回归 方法 求 取 最 优 方 程 。 先 
假定 方程 中 包含 全 部 变量 ,然后 进行 回归 检验 ,逐次 剔除 不 显著 的 因子 ,再 回归 再 
检验 ,直到 满意 为 止 。 每 剔除 一 个 因子 ,都 需 重新 回归 方程 系数 。 由 于 变量 之 间 可 
能 相互 联系 ,因此 一 次 只 能 剔除 一 个 因子 。 

(3) 从 包含 一 个 自 变量 开始 ,将 其 他 因子 逐个 地 引入 回归 方程 的 方法 称 为 朝 
前 选择 法 (FORWARD) ,其 过 程 和 前 面 的 退 后 消去 法 刚好 相反 。 首 先 计 算 各 个 自 
变量 与 因 变 量 的 相关 系数 ,把 其 中 相关 系数 最 大 的 自 变量 引入 方程 ,然后 从 余下 的 
自 变量 中 找 出 和 因 变 量 相关 系数 最 大 的 自 变量 ,再 引入 方程 , 直 把 所 有 影响 显著 的 
自 变量 引入 到 回归 方程 为 止 , 但 是 这 样 得 到 的 最 后 方程 并 不 能 保证 所 有 的 因子 都 
是 显著 的 。 因 为 各 个 自 变量 之 间 可 能 存在 着 一 定 的 相互 关系 ,原来 影响 显著 的 变 
量 在 引入 新 变量 后 ,其 显著 性 可 能 会 下 降 。 

(4) 逐步 回归 法 (STEPWISE), 它 是 在 FORWARD 法 基础 上 改进 的 回归 方 
法 ,结合 方法 (2) 和 方法 (3) 的 优点 , 边 引入 变量 边 检 验 ,直到 得 到 包含 全 部 显著 性 
影响 因子 的 回归 方程 为 止 。 这 包含 两 方面 内 容 : 对 新 的 有 显著 影响 的 变量 的 引 
人 和 人;@ 将 新 的 回归 方程 中 显著 性 差 的 变量 从 方程 中 剔除 。 因 此 它 可 以 克服 上 两 者 
的 缺点 。 

对 于 逐步 回归 方程 的 建立 和 检验 ,各 个 变量 的 选择 和 剔除 的 判断 标准 是 以 下 
检验 或 相关 系数 检验 为 基础 ,计算 相对 简单 。 当 然 ,模型 的 最 后 确定 同样 需要 经 过 
检验 。 

逐步 回归 法 一 般 是 多 元 线性 回归 中 的 较 好 方法 ,虽然 计算 繁琐 ,在 自 变 量 较 多 
时 效果 较 好 ,在 实验 数据 的 回归 中 得 到 了 广泛 的 应 用 。 对 于 自 变 量 较 少 的 回归 方 
程 建立 ,可 采用 退 后 消去 法 。 

如 假设 某 个 参数 有 四 个 可 能 的 因 变量 ,以 偏 相 关系 数 为 依据 ,在 给 定 显著 性 水 
平 a = 0. 10 下 进行 方程 的 逐步 回归 ,步骤 如 下 : 

(1) 计算 各 个 变量 与 y 的 简单 相关 系数 ,假设 为 

ns = 0.731, rzs = 0. 816, rss 0. 535, rss 0. 821 


为 xz 与 y 的 相关 程度 最 大 ,于 是 第 一 个 选 入 方程 的 为 xi 。 

(2) 关于 变量 zx 求 取 回归 方程 ,得 到 > 一 f(z), 并 对 方程 作 下 检验 , 设 总 体 
回归 的 下 一 22. 8, 大 于 下 的 临界 值 , 即 方程 的 检验 是 显著 的 ,应 保留 ri 。 
(3) 计算 其 他 三 个 变量 与 y 的 偏 相关 系数 ,假设 为 
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ris4 = 0.915, rzs.s = 0.017, rss.4 = 0. 801 


因为 zi 与 y 的 相关 程度 最 大 ,于 是 选 人 方程 的 变量 为 zi 。 

(4) 关于 变量 zx ,zx 求 取 回 归 方程 ,得 到 y = f(zx1，zs), 并 对 方程 作 下 检 
验 , 设 总 体 回归 的 下 二 176. 6, 大 于 下 的 临界 值 , 即 方程 经 检验 说 明 是 显著 的 ,并 对 
变量 zx， x 作 偏 下 值 检验 ,两 者 均 大 于 下 的 临界 值 , 故 应 保留 x1 ,xz 。 

(5) 继续 计算 其 他 两 个 变量 与 y 的 偏 相关 系数 ,假设 分 别 得 到 


rzs.41 = 0. 358, rss.u = 0. 320 


因为 zs 与 y 的 相关 程度 最 大 ,于 是 选 人 方程 的 为 rz 。 

(6) 关于 变量 zx ， x， xs 求 取 回 归 方 程 ,得 到 >= (zi ，z，zi), 并 对 方程 作 
下 检验 , 设 总 体 回归 的 下 大 于 下 的 临界 值 , 即 方程 经 检验 是 显著 的 ,并 对 变量 rm ， 
zz，z4 作 偏 下 值 检验 ,结果 表明 ,zi ，zs 两 者 的 偏 下 值 均 大 于 下 的 临界 值 ,而 zs 
的 偏 下 值 小 于 下 的 临界 值 , 故 应 保留 zx 和 zz ,而 将 x 剔除 。 

(7) 关于 变量 zi ，zs 重新 求 取 回 归 方 程 ,得 到 y = f(x1，xz), 并 对 方程 作 下 
检验 , 设 总 体 回 归 的 下 大 于 下 的 临界 值 , 即 方程 的 检验 是 显著 的 。 

(8) 最 后 计算 zs 与 y 的 偏 相 关系 数 ,假设 zs 的 偏 下 值 小 于 下 的 临界 值 , 故 仅 
保留 zx 和 zz ,而 将 x 吻 除 。 因 此 经 过 逐步 回归 后 ,所 得 的 回归 方程 y = (zi， 
Zs) 为 最 优 方 程 。 该 回归 方程 可 以 应 用 于 对 过 程 的 预测 .控制 等 。 

以 上 z 的 首先 引入 和 续 后 剔除 说 明 该 变量 不 是 独立 变量 ,而 变量 的 同时 引信 
和 同时 剔除 则 说 明了 逐步 回归 法 的 优越 性 。 

[ 例 14-5] 印发 道 等 对 肾 综合 征 出 血 热 (HFRS) 的 发 生 作 了 逐步 回归 分 析 ， 
并 进行 测报 ,提高 了 HFRS 预测 的 准确 性 。 他 们 发 现 黑 线 姬 鼠 密度 、 带 病毒 率 、 降 
雨量 均 与 HFRS 发 病人 数 有 显著 的 相关 关系 ,对 这 些 因 子 进行 逐步 回归 及 多 元 回 
归 分 析 , 探 讨 HFRS 发 病 数 的 消长 规律 。 选 择 3 个 月 前 的 降雨 量 、2 个 月 前 的 黑 线 
姬 和 鼠 带 病毒 率 为 因子 ,预测 2 个 月 后 HFRS 发 病人 数 ;选择 每 年 春季 降雨 量 为 因 
子 ,预测 该 年 HFRS 发 病 率 。 理 论 预测 值 与 实际 值 基本 吻合 ,并 成 功用 建立 的 回 
归 方 程 对 西安 郊 县 ( 户 县 和 周至 县 )HFRS 发 病 率 进行 短期 和 中 期 测报 。 

因为 降雨 量 可 以 改变 土壤 湿度 ， 继 而 影响 黑 线 姬 鼠 密度 ,最 终 影响 HFRS 发 
病 率 的 高 低 。 选 择 影响 HFRS 发 病 率 的 几 个 重要 因子 , 即 3 个 月 前 降雨 量 (zi )、 
2 个 月 前 带 病毒 率 (zz) .当月 黑 线 姬 鼠 密度 (zs: ) ,在 测报 时 还 综合 考虑 了 各 因子 的 
影响 。 

根据 1988 一 1993 年 的 数据 进行 逐步 回归 分 析 , 回 归 方 程 为 
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y( 户 县 ) 一 一 70. 66 十 7. 78 zz 十 17. 74 zs 
y( 周 至 ) 一 一 89. 18 十 1. 02 zi 十 13. 26 x 
y( 户 县 和 周至 ) 一 一 64. 79 十 1. 03 zi 十 10. 88 zs 


以 上 方程 的 复 相 关系 数 分 别 为 0. 952，0. 928，0. 894, 且 分 别 大 于 临界 相关 系 
数 y(0.01) 一 0. 886 及 0. 667, 说 明 回归 方程 显著 (中 国 媒介 生物 学 及 控制 杂志 [J]， 
1998 年 ,9(4))。 

[ 例 14 -6] 李 维 波 等 用 细胞 形态 计量 学 方法 统计 了 10 例 晚期 乳腺 单纯 癌 
病例 的 癌 细 胞 粗 面 内 质 网 ,核糖 体 的 12 个 超 微 结构 形态 参数 ,分 别 是 粗 面 内 质 网 
的 体 密度 Ni ,多 核糖 体 的 体 密度 N: ,游离 核糖 体 的 体 密度 Ni , 粗 面 内 质 网 的 面 密 
度 N, ,多 核糖 体面 密度 Ns ,游离 核糖 体 的 面 密度 Ne , 粗 面 内 质 网 的 比 表面 N ,多 
核糖 体 的 比 表 面 Ns ,游离 核糖 体 的 比 表面 Ns , 粗 面 内 质 网 的 面 数 密度 Nio ,多 核糖 
体 的 面 数 密度 Nu ,游离 核糖 体 的 面 数 密度 Ni 。 并 用 逐步 回归 法 进行 分 析 , 得 最 
优 回归 方程 : 

Y = 0. 222 + 0. 503Ns — 0. 013N; 


逐步 回归 中 设置 的 进入 回归 方程 的 变量 的 下 检验 用 显著 性 水 平 值 设 为 0. 05 ,剔除 
变量 出 方程 的 显著 性 水 平 值 设 为 0. 10, 先 后 进入 的 变量 为 Ne 和 N; ,计算 得 到 方 
程 的 复 相关 系数 R = 0. 852, F = 11. 887。 

回归 结果 筛选 出 区 分 正常 细胞 器 及 癌 细 胞 器 的 最 佳 参数 是 游离 核糖 体 的 面 密 
度 Ns 和 粗 面 内 质 网 的 比 表面 N; ,该 结果 可 为 根据 Nes，N 的 变化 程度 诊断 乳腺 
癌 提 供 一 定 的 定 县 依据 (昆明 医学 院 学 报 []],2001(1))。 


第 五 节 ”回归 方程 的 预测 和 控制 


科学 实验 的 目的 在 许多 情况 下 是 寻找 最 佳 的 实验 条 件 ,在 工程 上 经 常 是 寻找 
最 佳 的 生产 条 件 。 在 生产 过 程 或 科学 实验 中 ,利用 回归 的 数学 模型 对 其 实验 指标 
的 期 望 值 及 其 变动 范围 作出 估计 ,这 就 是 一 种 预测 问题 。 而 预测 的 送 问 题 则 是 
在 规定 某 个 指标 值 的 变动 范围 后 ,使 实验 或 生产 过 程 保持 稳定 ,这 称 为 控制 
题 。 根 据 回归 方程 ,从 而 可 通过 精确 预测 或 控制 ,努力 减少 实验 或 工艺 参数 的 随 
机 性 变异 。 

一 、 回 归 方 程 的 预测 

在 预测 问题 上 , 人 们 关心 的 是 回归 方程 的 预测 精度 , 即 对 于 自 变量 (z， 
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zz，…, za) 的 任何 一 组 观测 值 , 除 要 求 给 出 预测 量 y 的 估计 值 外 ,还 应 指出 它 的 
精度 ,就 是 需要 给 出 误差 的 方差 估计 值 。 因 此 ,所 谓 的 预测 实际 上 就 是 一 个 区 间 估 
计 , 即 在 一 定 的 显著 性 水 平 a 下 ,寻找 一 个 范围 4, 使 其 实际 的 观测 值 y。 落 在 区 间 
Cu 一 A, mm 十 A) 内 的 概率 为 1 一 c, 即 
P{(w—A<y <w+A)}=1—a 
对 于 多 元 线性 回归 方程， 
= = 二 br bry "二 barm +e 

由 于 y 的 回归 残 差 服从 正 态 分 布 ,因此 可 用 区 间 估计 求 取 A。A 不 仅 和 给 定 
的 显著 性 水 平 有 关 , 还 和 回归 方程 的 实验 点 数 n 有 关 , 而 且 和 实验 预测 点 zo 的 位 
置 有 关 。zxo。 和 距离 较 远 ,范围 A 就 大 ,预报 精度 就 差 。 故 将 线性 回归 方程 外 推进 
行 预测 ,可 能 与 实际 结果 相差 较 大 ,从 而 导致 不 正确 的 状况 。 因 此 ,在 回归 方程 的 
应 用 上 ,应 该 将 其 范围 尽量 限定 在 原来 的 实验 范围 内 ,不 要 随意 扩大 。 

在 实际 过 程 中 ,A 的 估计 比较 复杂 。 当 z。 和 距离 不 远 ,而 n 又 较 大 时 ,可 近 
似 地 认为 w 一 w ~ N(0, 0), 且 o 与 zo 的 位 置 无 关 。 

这 里 以 最 简单 的 一 元 线性 回归 为 例 ,对 于 实验 点 自 变量 x 相对 应 的 点 % 的 
点 估计 值 为 : 加 = 色 + 房 m, 而 且 它 是 yo 的 无 偏 估计 ,其 精度 ol 训 ) 一 


oY/ 溃 十 和 二 二 -而 对 于 任何 不 等 于 实验 点 (zi，zs，…,z,) 的 自 变量 xo, 随 


机 变量 yo 一 3 的 期 望 为 0。 由 于 和 是 Cy，y2，…， yn)n 个 独立 随机 变量 的 函数 ， 
不 仅 y 与 (2 ，y%，…，y) 是 独立 的 , 与 加 也 是 独立 的 ,于 是 可 得 
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Dy 一 人 ez[1+ 








为 了 求 取 实验 值 xn 的 区 则 估计 , 作 统计 量 : 一 (3 一 2)/ [of1+ 了 + 加 二 |， 


其 自由 度 为 f. 二 n 一 2, 在 给 定 显著 性 水 平 a 下 ,可 得 t 检验 临界 值 i ,满足 
pl(|t |<twz) 二 1 一 a, 得 到 yo 的 置信 区 间 为 


zy i 
区 ta soA/1 二 二 + Co Be /A++ 本 | 


同 理 , 对 于 已 知 的 自 变量 xz。 相对 应 的 点 yo 的 置信 区 间 为 


[ —} 二 了 地) |] 
I tyz*o 1 t ee 为 十 tus “oal 1 十 全 二 到 J 
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显然 ,试验 值 y 的 置信 区 间 为 zo 的 函数 。ze 和 人 > . yas 
云 越 接近 , 预报 区 间 越 小 , 则 预报 精度 越 高 ( 见 
图 14-3)。 $=botbr 





二 、 回 归 随 机 误差 的 控制 ! y=$-4(7) 
对 于 线性 回归 方程 的 控制 , 即 要 求 观测 值 y 具有 | 
一 定 精度 ,在 某 区 间 内 (ys，ys) 取 值 时 ,需要 控制 0 
在 什么 范围 内 , 求 取 z 的 控制 范围 (zi ,zi)。 对 于 给 。 图 14-3 回归 方程 的 
定 的 实验 数据 ,随机 误差 s = y; 一 uCi 二 1, 2, …， 珊 报 精度 


7)，, 假如 足够 大 ,随机 误差 服从 方差 为 5 的 正 态 分 布 ,y; 也 服从 数学 期 望 为 u,、 
方差 为 s 的 正 态 分 布 ,那么 可 知 y; 的 分 布 概率 为 

P{| y:—u |<s} = 68.27% 
即 P{w 一 s 二 yy 三 wi 十 s} 二 0.6827, 相应 地 还 有 


P{u—2s<y<wt+2s) 一 0.9545 
P{u—3s<y<ut3s} 一 0.9973 


对 于 给 定 的 冒 信 度 ,如 要 控制 y 的 变化 范围 , 则 可 从 方程 


Ww = f(r) 
=u = f(r) 





分 别 求 取 (zl， zs)。 
在 实际 控制 实验 数据 的 有 效 性 时 ,常常 可 以 士 3z 为 界限 ,认为 土 3 以 外 的 实 
验 点 为 不 正常 点 ,应 予以 别 除 。 





第 六 节 ”线性 回归 在 MATLAB 的 实现 


在 MATLAB 中 有 三 种 语句 用 于 线性 回归 ,分 别 是 多 项 式 回归 polyfit、 多 元 线 
性 回归 regress 和 逐步 回归 stepwise。 

一 、 多 项 式 回归 polyfit 

多 项 式 回归 的 语句 如 下 : 

p 一 polyfit(x,yyn) 或 

[p,s] 一 polyfit(x,y,n) 














-241- 


说 明 :x, y 为 已 知 数据 点 (数组 ),n 为 多 项 式 阶 数 ,返回 p 为 宕 次 从 高 到 低 的 
多 项 式 系数 向 量 p。x 必须 是 单调 的 。 矩 阵 s 用 于 生成 预测 值 的 误差 估计 ( 见 下 一 
函数 polyval) 。 

如 x=[12345];y=[1.01.31.5 2.02.3]; 

a= polyfit(x,y,1) 
输出 :a 二 0. 3300 0. 6300 

结果 为 :y 一 0. 33x 十 0. 63 

如 a 二 polyfit(x,y,2) 

输出 :a 一 0.0214 0.2014 0.7800 

结果 为 :y= 二 0. 0214x? 十 0. 2014x 十 0. 7800 

多 项 式 求 值 函 数 :y 二 polyval(p,x) 或 

[y,delta]=polyval(p, x,s) 

说 明 :y 三 polyval(p,x) 为 返回 对 应 自 变量 x 在 给 定 系数 p 的 多 项 式 的 值 。 

[ys,delta] 二 polyval(p,x,s) 使 用 polyfit 函数 的 选项 输出 s 得 出 y 和 其 误差 估 
计 detla。 它 假设 polyfit 函数 数据 输入 的 误差 是 独立 正 态 的 ,并 且 方 差 为 常数 , 则 
y 的 delta 范围 内 将 至 少 包 含 50% 的 预测 值 。 

还 可 使 用 拟 合 效果 绘图 (交互 式 ) 语 句 :polytool(x,y,p)。 

如 上 例 的 一 元 线性 回归 polytool(x,y,1) ,得 到 图 14 - 4; 二 次 回归 polytool(x， 
y,2) ,得 到 图 14- 5。 在 图 上 可 直观 看 到 数据 的 拟 合 情 况 , 包 括 拟 合 曲线 和 两 侧 的 
置信 区 间 ,并 可 在 Export 区 域 输出 模型 回归 参数 及 其 置信 区 间 、 预 测 值 y 及 其 置 
信和 区间、 数据 点 的 残 差 。 
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图 14-4 一 元 线性 回归 图 图 14-5 二 元 线性 回归 图 
多 项 式 回归 polyfit 函数 可 用 于 一 元 线性 回归 ,动态 数据 平滑 等 。 














二 、 多 元 线性 回归 regress 


在 MATLAB 中 regress 函数 主要 用 于 线性 回归 ,包括 一 元 以 及 多 元 线性 
回归 。 
对 于 方程 式 :Y 二 Xb 十 EE, 简 单 求 模型 参数 b 的 语句 是 
b=regress(Y,X) 


式 中 :Y 表示 一 个 nX1 的 矩阵 ,又 是 nX(m 十 1) 和 矩阵 , 自 变量 xCm 列 ) 和 一 列 具 有 
相同 行 数 , 值 是 1 的 矩阵 的 组 合 。b 是 (m 十 1) X1 和 矩阵 , 即 


b= [Lbo bi bz bb] 
另 一 语句 可 提供 更 多 信息 : 
[b,bint,r, rint, stats ]=regress(Y,X,alpha) 


式 中 :alpha: 显 著 性 水 平 , 缺 省 时 为 0.05。 
b,bint: 回 归 系 数 估计 值 和 其 置信 区 间 ,bint 是 系数 估计 值 的 置信 度 为 95% 的 
置信 区 间 , 其 中 第 一 个 值 表示 常数 ,第 二 个 值 起 表示 回归 系数 。 
rrint: 各 点 残 差 和 其 置信 区 间 。 
stats: 检 验 回归 模型 的 统计 量 , 有 三 个 数值 ,[R2, F, P( 与 下 值 对 应 的 概率 )] 
alpha 是 显著 性 水 平 ( 缺 省 的 时 候 为 0. 05) 。 相 关系 数 R2 越 大 ,说 明 回归 方程 
越 显著 ;与 F 对 应 的 概率 P<alpha 时 候 拒绝 H0, 回 归 模型 成 立 。 
残 差 和 其 置信 区 间 的 绘图 语句 :rcoplot(ryrint) 。 
仍 以 多 项 式 回 归 的 数据 为 例 , 作 一 元 线性 回归 |: 
x=[1 2 345];y=[1.0 1.31.5 2.0 2.3]; 
X=[ones(5,1) x']; 
Y=y'; 
[Lb,bint,r, rint, stats ]=regress(Y,X) 
rcoplot(r, rint) 
得 到 结果 : 
| 
0. 6300 
0. 3300 
bint = 
0.3644 0. 8956 
0. 2499 0. 4101 


-243- 


r 一 
0. 0400 
0.0100 

一 0. 1200 
0. 0500 


0. 0200 


一 0.1343 0.2143 
一 0.2485 0.2685 
一 0.1836 ”一 0.0564 
一 0.1839 0.2839 
一 0.1709 0.2109 
tats = 
0. 9829 171.9474 0.0010 
所 得 的 结果 :y = 0. 33x 十 0. 63, 和 多 项 式 回归 polyfit 一 致 ( 见 图 14 - 6) 。 


Residual Case Order Plot 
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图 14-6 多 元 线性 回归 


三 、 逐 步 回 归 的 MATLAB 实现 
逐步 回归 语句 提供 交互 式 画面 ,格式 为 


stepwise(x,y,inmodel,alpha) 
式 中 :xCnx m), y(nx1), inmodel 是 矩阵 x 的 列 数 的 指标 或 初始 模型 的 列 数 ,如 
缺 省 则 为 全 体 x,alpha 是 显著 性 水 平 。 
简化 的 常用 语句 :stepwise(x,y) ,运行 后 产生 三 个 交互 式 图 形 窗口 : 
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Stepwise Regression Plot, 图 示 回 归 系 数 及 其 t 统 计量 ,并 有 统计 计算 的 结果 
输出 按钮 Export, 可 输出 回归 相关 的 各 个 参数 ,包括 回归 系数 及 其 置信 区 间 , 模 型 
的 统计 量 ; 在 这 个 窗口 中 还 有 变量 移入 和 移出 的 操作 按钮 ,完成 整个 回归 分 析 。 图 
中 的 绿色 表明 在 模型 中 的 变量 ,红色 表明 从 模型 中 移 去 的 变量 。 

Stepwise Regression Diagnostics Table, 列 出 统计 表 , 包 括 回归 系数 及 其 置 
信 区 间 ,模型 的 统计 量 (RMSE 剩余 标准 差 ,R2, F, P 等 ) 相 当 于 regress 输出 


内 容 。 


Stepwise History Plot, 图 示 RMSE, 每 次 选择 不 同 模型 后 的 结果 。 

以 MATLAB 软件 中 的 典型 事例 反应 热 为 例 。 

[ 例 14 -7] 某 复合 物 凝固 时 放出 的 热量 y 与 该 复合 物 中 4 种 化 学 成 分 xz! ， 
za，2za， Xs 有 关 , 今 测 得 一 组 数据 如 下 ,试用 逐步 回归 来 确定 一 个 线性 模型 ( 见 


























表 14-7)。 
表 14-7 逐步 回归 确定 线性 模型 
序号 2 I 2 zt y 
1 7 26 6 60 78.5 
2 1 29 15 52 74.3 
3 11 56 8 20 104. 3 
4 11 31 8 47 87.6 
5 a 52 6 33 95.9 
6 11 55 9 22 109. 2 
7 3 71 17 6 102.7 
8 1 31 22 44 72.5 
9 2 54 18 22 93.1 
10 21 47 4 26 115.9 
11 1 40 23 34 83.8 
12 11 66 9 12 113.3 
13 10 68 8 12 109.4 
编写 程序 如 下 : 
clc,clear 
x0=[7 26 6 60 78.5 
1 29 15 52 74.3 
11 56 8 20 104.3 
il “31 8 47 87.6 
人 52 6 33 95.9 
ll 55 9 22 109.2 
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3 71 17 6 102.7 

1 31 22 44 72.5 

2 54 18 22 93.1 

21 47 4 26 115.9 

1 40 23 34 83.8 

11 66 9 到 113.3 

10 68 8 12 109. 4]; 
x=x0(:,1:4); 
y 一 x0(:,5); 
stepwise(x,y) 

得 到 Stepwise Table 如 下 ( 见 图 14- 7)。 
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图 14-7 逐步 回归 图 
可 以 根据 变量 移出 和 移 人 的 提示 操作 ,从 而 得 到 最 优 方程 。 从 各 次 统计 结果 
可 以 看 出 ,虽然 剩余 标准 差 RMSE) 没 有 太 大 的 变化 ,但 是 统计 量 下 的 值 明显 增 
大 ,因此 新 的 回归 模型 更 好 一 些 。 使 用 前 面 的 回归 分 析 方法 ,可 以 求 出 最 终 的 模 
型 为 
y= 103. 097 十 1.440zxi 一 0. 614z4 


本 章 学 习 要 点 : 

(1) 了 解 回 归 分 析 的 基本 原理 。 

(2) 了 解 一 元 线性 回归 的 计算 。 

(3) 应 用 MATLAB 计算 多 元 线性 回归 。 
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第 十 五 章 ” 非 线性 模型 的 求解 


第 一 节 ” 非 线性 模型 的 线性 化 


在 生命 科学 中 ,由 于 过 程 的 极其 复杂 性 ,一 般 实验 所 涉及 的 数学 模型 多 为 非 线 
性 模型 。 而 非 线性 模型 由 于 模型 参数 估计 的 困难 ,常常 转化 为 线性 模型 进行 求解 。 
其 中 典型 的 是 多 项 式 的 线性 化 处 理 , 如 果 非 线性 方程 可 以 转化 为 以 下 回归 方程 的 
形式 ， 
Fo(zi，ze，…，Zzo，y) 
一 ae 十 PCzy Tos Ta) asFa(Ty, Ts my， To) 十 … 十 QFPFeCz Tes, Tn) 


这 一 类 问题 均 可 以 化 为 多 元 线性 回归 问题 加 以 处 理解 决 。 
一 、 常 用 函数 式 的 线性 化 转换 


对 于 非 线 性 方程 ,可 对 自 变 量 或 因 变量 进行 适当 的 变量 变换 ,把 曲线 方程 转化 
为 直线 方程 。 通 过 变换 ,能 简便 地 转化 为 线性 化 方程 的 非 线性 模型 列 于 下 面 。 在 
选择 模型 时 ,可 通过 标准 曲线 的 形状 来 进行 。 

常用 函数 线性 化 转换 表 : 

(1) 双 曲 线 模型 : 1/y = 如 十 bi/z。 

线性 化 模型 :Y = b 十 bX， 

式 中 :Y= 1/y, X= 1/z。 

(2) 窜 函 数 模型 :y = b。， x” 。 

线性 化 模型 :Y = Bo 十 bX， 

式 中 :Y = ln(y), X= In(zx), Bo = ln(b,)。 

(3) 指数 孔 数 模型 :y 二 b。，b。 

线性 化 模型 :Y = Bo 十 BiX， 

式 中 :Y = In(y), X 一 Bi = ln(b), B, = ln(b,)。 

《4) 自然 指数 函数 模型 :y = 如 .exp(bz)。 

线性 化 模型 :Y = Bo 十 B,X， 
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式 中 :Y = ln(y), X=x, Bi 一 总， Bu 一 jn(bo)。 
(5) Gauss 指数 函数 模型 :y 一 bo。* exp(b /zx)。 
线性 化 模型 :Y = Bo 十 BiX， 

式 中 :Y = ln(y), X 一 1/zx, B=bh, Bo = ln(bo)。 
(6) 对 数 函 数 模型 :y = bo 十 户 ，ln(z) 。 
线性 化 模型 :Y = Bo 十 BIX， 

式 中 :Y= 二 y, X= In(z), B=b, B=b。 

(7) 倒数 -对 数 函数 模型 :1/y = bo 十 by ，In(x)。 
线性 化 模型 :Y = Bo 十 BX， 

式 中 :Y = 1/y, X= In(z), B=b, Bo= bo。 
(8) S 模 型 ; 1/y = bo 十 bl ，exp( 一 工 )。 
线性 化 模型 :Y = Bo 十 BiX， 

式 中 :Y = 1/y, X 一 exp( 一 z)，B 一 六，Bo 一 名 


(9) Logistic 曲线 : y 一 Te 

线性 化 模型 :Y = Bo 十 BIX， 

式 中 :Y = ln[(K 一 y)/y], X=zx, B= lna, Bo b。 

在 生命 科学 中 有 许多 经 典 方程 可 转化 为 线性 求解 。 如 在 生物 化 学 中 利用 凝 胶 
层 析 测定 生物 大 分 子 的 相对 分 子 质量 MW 时 ,相对 分 子 质量 的 大 小 和 洗 脱 液 的 体 
积 具 有 如 下 关系 : 



































log MW = a+obV 

令 Y = log MW, 则 方程 即 转化 为 线性 方程 。 

根据 不 同 要 求 ,可 将 同一 方程 转化 为 不 同 的 线性 方程 进行 求解 .如 著名 的 酶 动 
力学 M-M 方 程 ,r, = rmwxC./(Ksm 十 C;)。 在 已 知 r, 和 C, 的 前 提 下 , 求 取 模型 参数 
K。 和 rmx ,为 满足 不 同 的 动力 学 分 析 需 要 ,可 以 将 方程 转换 为 以 下 四 种 形式 : 

(1) Lineweaver- Burk 法 ,方程 为 /rs == 1/rmex 十 (Kmn/rmax)* 1/C,。 

(2) Hanes - Woolf 法 ,方程 为 C./rs 二 Km/rmex 十 Cs/rmax 。 

(3) Eadie - Hofstee 法 ,方程 为 rs 一 rmx 一 Kn * rs/C:。 

(4 积分 法 ,方程 为 节 CCo 人 cs UK 。 

各 方程 的 直线 如 图 15 - 1 所 示 。 

二 、 多 元 函数 线性 化 的 扩展 


多 元 线性 函数 的 标准 形式 为 








t 
rm/ Ku。 区 = 区 
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GC 
Uh 


和 斜率 =]/row 





RO vc, 





(9) 





图 15-1 M-M 方 程 的 不 同 线性 化 处 理 
(a) L-B 法 ; (b) H-W 法 ; (c) E- 日 法 ; (d) 积分 法 


?一 名 十 名 zi 十 加 rz 十 … 十 bmzm 
如 多 项 式 函数 方程 : 
y=bo 十 BT 十 Bor? 十 十 bm” 


标准 三 角 函 数 ， 


4 
3 一 ao 十 [ascos(iz) 二 brsin(izr)] 


Ee 
等 等 ,都 可 以 通过 变量 变换 将 其 转化 为 多 元 线性 函数 的 标准 化 形式 。 
还 有 其 他 各 种 函数 的 混合 形式 ,也 可 通过 变换 将 其 转化 为 标准 化 形式 。 如 非 
线性 函数 : 
y =a* exp[brit bz +b (rir) tb (rir,)] 
可 以 先 对 方程 两 边 取 对 数 , 得 


Iny= lnatbz br? tb (Tir) + bh (xixr:) 





然后 令 z= Iny, b= lnayti = ts = Zi, t= rT ta 一刀 zr, 即 得 z 一 各 
+htit bt tt bats tt bts。 
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采用 多 元 线性 回归 ,可 以 求 取 各 个 待定 参数 ,得 到 模型 方程 。 
根据 最 小 二 乘法 ,这 里 的 目标 函数 是 


Q= Dz, —zi.a)’ = min 


而 不 是 Q = 2) (y 一 ym)? 一 min。 
由 于 这 两 个 目标 函数 有 差异 ,因此 所 得 到 的 回归 参数 也 会 有 差别 。 不 过 该 数 
学 模型 由 于 经 过 线性 变换 ,回归 过 程 就 变 得 比较 简单 。 但 是 上 述 的 线性 化 并 不 是 
万 能 的 ,对 于 有 些 模 型 的 参数 回归 时 ,线性 化 方法 可 能 会 导致 收敛 较 慢 ,造成 迭代 
次 数 很 大 ,其 至 出 现 结果 发 散 的 极端 情况 。 
对 于 函数 式 用 微分 方程 形式 给 出 时 ,一 般 可 先 对 微分 方程 积分 , 求 取 微分 方程 
所 包含 的 待定 参数 的 解析 解 。 然 后 将 其 线性 化 , 转 为 普通 线性 方程 进行 求解 。 如 
猎手 - 食 饵 系统 的 数学 模型 为 
dr/di 一 az 一 pry 
dy/dt = cry—dy 


简化 为 和 = 全 人 一 闪 们 二 人 ,分离 变 量 后 得 到 


(a/y—b)dy= (c—d/z)dr,(r>0,y>0) 
两 边 求 积分 , 即 得 
alny 一 by == cr 一 dlnx 十 C, C 为 积分 常数 
从 而 转化 为 线性 方程 ,对 a, b,c，d 等 参数 进行 求解 ,并 可 以 描述 z(t)，y(2) 
关于 时 间 的 变化 曲线 。 
另外 ,还 可 以 利用 常 微分 方程 的 初 值 问题 解法 ,对 函数 关于 时 间作 离散 化 
处 理 。 
总 之 ,一 元 非 线性 回归 的 线性 化 可 以 推广 为 多 元 非 线性 回归 的 线性 化 形式 为 
以 下 情形 ,假设 原 方程 为 


Crzi，zrz，…，zo yp bb) 一 0 
经 过 变换 后 为 
Fo(zi，zz，…，Toy) 
一 0 十 QFII Tor zi) 十 azFz(z rz) 十 … 十 atFeCz Xa, Tn) 


只 要 方程 右边 的 FF ，F,,…，F 中 不 包含 模型 参数 , 即 为 线性 函数 。 通 过 重新 定 
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义 变量 ,可 以 转化 为 标准 线性 方程 形式 : 


一 ao 十 at 国 十 aztz 十 … 十 aatt 


第 二 节 ” 非 线性 模型 的 拟 合 


并 非 所 有 的 非 线 性 模型 均 可 以 进行 线性 化 ,这 时 也 可 以 按 最 小 二 乘法 的 原理 
对 非 线 性 函数 进行 拟 合 。 非 线性 函数 的 拟 合 经 过 最 小 二 乘法 处 理 后 ,所 得 到 的 参 
数 求解 方程 仍然 是 非 线 性 方程 ,需要 对 方程 组 进行 非 线 性 求解 。 非 线性 方程 组 求 
解 的 常用 方法 有 牛顿 法 和 和 迭代 法 。 
一 、 非 线性 方程 组 的 求解 
对 于 非 线性 方程 组 的 迭代 法 求解 ,其 解法 和 非 线 性 方程 的 迭代 过 程 相似 , 即 构 
建 迭代 式 : 
X= BX) 
X’ = XY = BX®) 
式 中 :发 一 [zi，z，…，zo]， 迭代 收敛 的 条 件 是 迭代 方程 5(X) 的 雅 可 比 矩 阵 的 
范 数 ( 即 矩 阵 的 空间 距离 或 向 量 的 大 小 ) 小 于 1。 
非 线性 方程 组 的 牛顿 法 求解 以 二 元 方程 组 为 例 : 
di y=0 
(gz(Cz，y) 一 0 


下 面 的 (xs，yi) 表 示 方 程 的 未 知 参 数 迭代 序列 。 
类 似 于 一 元 非 线性 方程 的 牛顿 法 ,在 某 一 点 (zs，y) 按 泰勒 级 数 展开 ,忽略 二 
级 以 上 高 级 项 , 即 可 以 得 到 线性 化 的 近似 式 : 


ix, y) = g(r, y+ |, y4) AX + ln, yA = 0 


Bir, y) = gz(zey 0) +l (Cn, Ye) A + 闻 e| (ze» YAY 一 0 


式 中 1 于 a 于 是 非 线性 方程 转化 为 变量 为 Art 和 Ays 的 线性 正规 方 
ky 


程 组 。 


= 


Tit =Xi + Axs, 
url 一 义 十 Ay， 


他 人 (a 人 Ar 
4 一 一 4 
Ayo 1 Ay yz Ay: 


一 直到 满足 所 要 求 的 计算 精度 为 止 , 即 人 EE 
二 1~Eo 


这 时 所 得 的 解 (rri，?er ) 即 为 (zx"，y* ) 的 近似 解 。 
同 理 ,将 二 元 非 线性 方程 回归 推广 到 多 元 非 线性 方程 回归 ,已 知 方程 : 


解 该 方程 组 的 法 代 公式 为 假定 初 值 为 (x。，y。), 即 可 解 得 


filxis ra "ey Ts) = 0,i=1,2,.,n 


经 过 类 似 以 上 的 处 理 ,模型 回归 同样 可 以 转化 为 以 (Ari，Azrz，…，Az ) 为 未 知 参 
数 的 线性 方程 组 进行 求解 ,该 方程 组 可 采用 和 迭代 的 方法 计算 ,直到 得 到 满足 下 面 方 
程 的 要 求 精度 的 根 : 
一 XD = 十 AN 
转化 后 的 线性 方程 组 形式 为 J(X)AX = 一 F(X* ), 式 中 的 方程 系数 矩阵 为 雅 
. 可 比 矩 阵 , 即 为 





[aA 3A ... of 

Br x; Qzv 

af af ... dfs 

J(X) = | ar 9zz Ox, 
9f of ... df 

| ar! ar ar， 


在 MATLAB 软件 中 ,和 迭代 法 仍然 可 使 用 求解 非 线性 方程 的 函数 fzero 和 

fsolve, 调 用 格式 也 基本 相同 ,但 变量 x 须 变 成 向 量 X。 具 体格 式 如 下 : 
x 一 fsolve(C fun',x0)， 或 ”x= fsolve( fun',x0,options) 

式 中 fun: 函数 或 函数 向 量 , x0: 初 值 , options: 计算 参数 设置 , 详 见 MATLAB 
Help。 

用 牛顿 法 求解 须 编写 M 文件 ,确定 其 迭代 方程 和 雅 可 比 矩 阵 。 函 数 fun 的 编 
写 参见 下 例 。 

[ 例 15-1] 求解 非 线性 方程 组 : 
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户 王 4z 十 验 十 2zizs 一 一 2 一 0 
户 一 2z 十 验 十 3zizz 一 3 一 0 
现 编写 其 函数 文件 ,定义 工 一 [zi zz]】 
fun 一 [4* x(1)*2 十 x(2)*2 十 2x*x(1)x*x(2) 一 x(2) 一 2; 
2x x(1)“2 十 x(1)"2 十 3xx(1) xx(2) 一 3] 
代 人 和 人 fsolve 即 可 。 
二 、 非 线性 拟 合 


非 线性 函数 的 拟 合 过 程 是 ,给 定 n 组 实验 测量 值 (zx, ye) ,二 1,2,…, n, 要 
求 确定 非 线性 函数 y = f(x, b) 中 的 非 线性 参数 b, 可 使 y 的 残 差 平 方 和 : 





Q= Fy — f(x, bY = min 
k=1 


式 中 : 自 变量 x 是 一 个 向 量 , x = (zuy，zza，…，zt)(R 一 1，2，…，7)， 参数 b 也 
是 一 个 向 量 , = (bi, 加 ，…， bmn) (mn)。 

常用 的 求解 方法 是 基于 最 小 二 乘法 原理 ,采用 高 斯 -牛顿 法 (Gauss - Newton) 
和 麦 夺 特 法 (Marquardt) 对 该 非 线 性 模型 线性 化 。 

多 变量 最 小 二 乘法 的 残 差 和 一 元 回归 一 样 定义 为 实验 值 与 计算 值 之 差 ， 

6 一 外 一 xb) 

非 线 性 模型 正确 与 否 , 残 差 的 大 小 不 仅 和 模型 参数 有 关 , 而且 还 取决 于 变量 实验 值 
本 身 的 测量 误差 。 当 参数 完全 正确 时 , 残 差 即 等 于 实验 误差 。 因 此 ,最 佳 的 一 种 参 
数 估计 值 不 仅 应 该 确保 残 差 最 小 ,而 且 还 应 使 残 差 的 分 布 与 实验 随机 误差 的 分 布 
相当 ,所 以 , 它 的 目标 函数 对 多 参数 变量 应 该 是 残 差 的 加 权 平方 和 最 小 , 即 


Q= qi? 一 min 
以 两 个 变量 的 非 线性 拟 合 为 例 , 假 设 方程 为 
3 一 Crzi，xzzy， bp) 
要 求 Q = Dr — (zs zy 所， by)]* 一 min。 对 QQ 关于 6b，, bs 求 偏 导数 ,假设 


得 到 如 下 形式 的 两 个 方程 ， 


人 Zi» Xz, bi, pp) 一 0 
8z(y，zl zy bi, bs)=0 
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式 中 :y，z， za 为 已 知 的 经 过 多 次 测定 的 组 实验 数据 ,b,，b: 为 待定 的 模型 参 
数 ,那么 方程 就 是 普通 的 以 b，bs 为 未 知 变量 的 二 元 非 线性 方程 形式 。 可 用 前 面 
介绍 的 非 线 性 方程 组 迭代 法 或 牛顿 法 求解 。 

牛顿 法 求解 的 收敛 效果 和 初 值 的 设 定 值 有 关 , 要 求 提供 较 好 的 初 值 ,但 是 对 于 
许多 实际 问题 ,要 选择 一 个 较 好 的 初 值 是 相当 困难 的 。 如 需 确保 收敛 效果 ,可 以 采 
用 非 线性 方程 求解 时 常 采 用 的 收敛 方法 。 

[ 例 15-2] 以 Monod 细胞 生长 模型 对 SPSC 自 絮 凝 酵母 细胞 颗粒 培养 过 程 


pnS 
进行 拟 合 , 其 模型 方程 为 y = 二 二 5。 


实验 数据 如 表 15 - 1 所 示 ( 白 凤 武 。 生 物 工 程 学 报 []],2000,15(4))。 
表 15-1 实验 数据 











p/h™' |0.0366|0.0510|0.0693|0.0600 |0.0812|0.0804|0.0801|0.0925|0.0930|0.0979 


该 方程 为 两 参数 的 非 线性 方程 ,比较 简单 ,可 以 按 非 线性 拟 合 ,也 可 按 线性 化 
拟 合 ,根据 不 同 的 目标 函数 而 定 。 经 非 线 性 拟 合 可 得 到 动力 学 模型 方程 为 w 一 
0. 134S 





19.23 十 S” 
如 果 考 虑 产物 酒精 生成 的 抑制 作用 ,选用 方程 : 


-站 Fs (起 )] 


在 已 知 w，S, P 的 前 提 下 ,就 必须 采用 非 线性 拟 合 估计 模型 参数 。 





第 三 节 ” 非 线性 回归 模型 的 检验 


一 、 机 理 检验 


不 管 是 什么 模型 ,其 计算 结果 均 应 该 和 实验 结果 相符 合 , 必 须 经 过 实际 检验 后 
才能 应 用 。 非 线性 模型 一 般 都 是 机 理 模型 或 半 机 理 模型 ,其 模型 参数 一 般 具 有 一 
定 的 物理 意义 ,参数 的 数值 大 小 及 其 符号 , 均 有 其 一 定 的 含义 或 变化 规律 ,所 以 模 
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型 的 正确 与 否 可 以 根据 实验 的 规律 来 分 析 判断 , 称 为 机 理 判断 。 
如 计算 饱和 燕 汽 压 的 安 托尼 方程 In p. = A 一 ;地 ,如 果实 验 数 据 正确 ， 


ln p, cc ;二 -两 者 成 线性 关系 ,c 和 4 的 数量 级 相当 .如 果 不 是 预计 的 关系 , 则 说 明 


实验 数据 存在 问题 。 

如 计算 反应 速率 常数 的 模型 方程 A 一 k(T) cc e 兰 ,常数 和 温度 成 一 定 的 
关系 ,活化 能 AE 具有 一 定 的 变化 范围 。 

如 参数 估计 值 不 符合 这 些 要求 , 则 应 对 其 进行 分 析 和 考虑 ,对 模型 作 进一步 的 
研究 。 但 这 些 都 需要 有 一 定 的 专业 知识 来 分 析 , 而 采用 专业 知识 判断 模型 不 是 本 
课程 所 解决 的 问题 。 


二 、 方 差 检验 


非 线 性 模型 也 可 以 采用 方差 检验 ,但 是 非 线 性 模型 的 方差 分 析 比 较 困 难 。 因 
为 模型 的 方差 检验 方法 是 从 线性 回归 中 推导 出 来 的 ,如 要 用 于 非 线性 模型 ,经 常 要 
加 上 一 个 安全 系数 ,再 进行 比较 。 安 全 因子 通常 是 3 一 10, 根 据 实际 需要 而 定 。 
如 果 





F= SR/S? 学 (山本 和 >G~Iorcu 1 


可 以 认为 模型 有 效 ;反之 , 当 F, 一 (3 一 10)FE(C， 记 时, 却 不 能 排除 模型 的 正确 
性 ,这 只 能 说 明 数 据 的 拟 合 能 力 较 差 。 特 别 要 注意 ,不 能 采用 相关 系数 法 进行 非 线 
性 模型 的 参数 之 间 的 检验 。 

对 于 已 进行 了 线性 化 的 非 线 性 模型 的 检验 ,所 检验 的 量 是 针对 变换 后 的 响应 
值 而 进行 的 。 因 此 ,这 时 要 特别 注意 变换 后 的 线性 模型 的 残 差 是 否 还 满足 最 小 二 
乘法 的 要 求 , 即 误差 相互 独立 ,而 且 e ~ N(0, o), 尽管 原来 的 非 线性 模型 的 残 差 
满足 最 小 二 乘法 的 要 求 ,符合 随机 误差 的 规律 。 


三 、 残 差分 析 


模型 的 方差 分 析 仅仅 说 明 模型 的 计算 值 和 实验 值 之 间 的 拟 合 程度 ,从 大 范围 
上 说 明 残 差 与 实验 误差 是 否 相当 ,并 不 能 从 根本 上 了 解 模型 的 缺陷 。 数 学 模型 特 
别 是 非 线 性 模型 最 主要 的 检验 方法 是 采用 残 差分 析 , 从 而 可 以 进一步 考察 模型 的 
优 缺 点 ,并 修正 模型 。 残 差分 析 的 原理 是 判断 其 实验 数据 和 回归 值 的 残 差 是 不 是 
符合 正 态 分 布 。 如 果 表 明 残 差 不 符 合 正 态 分 布 , 即 可 以 认为 模型 不 够 准确 。 具 体 
的 分 析 方 法 有 : 
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了 1. 残 差 直方 图 (图 15- 2) 
在 实验 数据 很 多 时 ,可 用 类 似 误 差 的 直方 图 作 残 
差 直方 图 。 以 直观 的 形式 判断 其 实验 数据 与 回归 值 
的 残 差分 布 是 不 是 符合 正 态 分 布 。 
2. 残 差 一 y; 图 , 残 差 一 x; 图 (图 15 - 3) 
由 于 残 差 是 实验 中 无 法 控制 的 因素 造成 的 ,实验 
误差 与 实验 点 的 位 置 无 关 ,应 将 计算 值 和 实验 值 同 时 
5 0 te 作 图 ,分 析 残 差 大 小 的 分 布 是 否 具有 随机 正 态 分 布 的 
图 15- 2 残 差 直方 图 。” 特 点。 否则 应 该 修改 模型 。 





Hi 





图 15- 3 残 差 一 y 图 , 残 差 一 z 图 


3. 参数 残 差 (图 15 - 4) i 
将 上 述 因 变 量 的 残 差 定义 引申 到 模型 中 具体 参数 
的 残 差 ,观测 某 个 参数 的 计算 值 和 实验 值 之 间 的 残 差 是 olss 
否 服从 随机 变量 的 分 布 , 是否 具有 随机 正 态 分 布 的 
特点 。 -s 


四 、 模 型 的 检验 和 选择 图 15-4 参数 残 差 图 


对 于 非 线性 的 半 机 理 模型 ,有 时 也 有 许多 不 同 的 模型 可 供 选 择 。 即 使 对 于 同 
一 个 目标 函数 ,可 能 其 中 任何 单个 模型 的 处 理 结果 ,不 论 采用 何 种 检验 如 方差 检 
验 、 残 差 检验 都 是 正确 的 ,但 是 模型 之 间 的 总 体 方差 或 残 差 还 是 存在 区 别 。 如 果 对 
计算 结果 有 所 选择 或 要 求 , 应 该 对 各 种 可 能 选择 的 模型 均 进行 回归 分 析 , 从 中 挑选 
最 令 人 满意 的 模型 。 

如 将 玉米 的 生物 增长 模型 用 于 玉米 生长 的 研究 分 析 ,试验 测 得 以 下 样本 数据 ， 
其 中 Y 表示 4 株 收获 地 干 玉米 样本 的 重量 均值 (g),， 工 表示 玉米 从 开花 到 收获 的 
时 间 均 值 ( 见 表 15 - 2 一 表 15 - 4) 。 








人 5 和 二 


表 15-2 样 本 1 
Y/g 11. 44 | 29.51 | 69.05 | 98.79 138. 01 | 162. 82 








T/d 13. 625 | 19.750 28. 625 | 41.750 49. 625 | 69. 625 





表 15-3 样本 2 


Y/g 3.52 | 10. 56 41. 55 94.55 | 122.52 130. 19 


T/d 6. 500 14. 875 24. 625 35. 875 49. 875 56. 875 

















表 15-4 样本 3 
这 
| 5o5l | 60.83 | 84.78 
29.625 | 39.625 








96. 46 | 97.02 | 172.41 


46. 375 


14. 26 





















17. 125 25. 625 54. 250 





对 于 以 上 数据 ,可 以 同时 选择 单 分 子 增长 模型 dy/d = Ca 一 >)。 式 中 :y 表 示 
随时 间 :变化 的 生物 量 ,c 表示 增长 的 极限 ,k 是 模型 常数 ,对 方程 积分 后 ,方程 可 转 
化 为 y= 二 a(l 一 Be*)。 

也 可 以 选择 Logistic 模型 , 即 dy/d = ky (a 一 y)/alk 之 0)。 对 方程 积分 后 ,可 
转化 为 y 二 a/(1 十 Be*)。 

也 可 以 选择 Gompertz 模型 , 即 dy/dt = kyln(a/y)。 对 方程 积分 后 ,可 转化 为 
y =aexp(—Be*), 

对 于 上 述 不 同样 本 的 情况 ,为 选择 最 适合 的 数学 模型 ,不 仅 要 选择 总 体 的 适合 
模型 ,还 要 分 析 不 同样 本 的 适合 情况 。 因 此 ,具体 什么 模型 适合 于 什么 情况 ,要 根 
据 实 际 情况 具体 分 析 而 确定 。 


第 四 节 ” 非 线性 回归 在 MATLAB 的 实现 


在 MATLAB 的 统计 工具 箱 中 ,利用 nlinfit，nlparci，nlpredci，nlintool 可 方 
便 地 进行 非 线 性 回归 ,可 以 得 到 回归 系数 和 其 置信 区 间 及 其 预测 值 。 
应 用 语句 为 : 
[beta,r,J]=nlinfit(x, y,function, beta0) 
式 中 :x, y 为 列 向 量 ,function 为 函数 y 的 子 程序 名 ,beta0 为 初 值 。 
返回 值 :模型 系数 beta, 残 差 r, 雅 可 比 矩 阵 ], 这 些 参数 可 用 于 其 他 语句 的 计 
算 。 回 归 求 解 的 数学 原理 是 采用 高 斯 -牛顿 法 。 
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利用 返回 值 计算 的 语句 有 : 
betaci 一 nlparci(beta,r,J) ;输出 回归 系数 和 置信 区 间 (95%) 
[ypred, delta]=nlpredci(function, xinput, beta,r,]) ;预报 xinput 的 ypred 
值 和 置信 区 间 (95%) 
nlintool(x,y,function', beta0,alpha,'x','y') ;得 到 一 个 交互 式 画 面 ,Export 区 
可 传输 模型 参数 ,包括 模型 参数 、 标 准 差 等 。 
[ 例 15~-3] 已 知 水 在 不 同 温度 下 的 饱和 蒸汽 压 数据 如 表 15 - 5 所 示 : 


表 15-5 茹 汽 压 数据 











现 用 Antoine 方程 拟 合 , 求 其 模型 参数 ,并 进行 残 差 检验 。 方 程 为 
lnP,= A—B/(T+COC) 
式 中 ;P, 为 他 和 蒸汽 压 (mmHg)，T 为 温度 (K) 。 
如 以 P, 的 残 差 平 方 和 最 小 为 目标 函数 ,定义 相应 函数 文件 : 
antoine. m 
function y= antoine (beta, x) 
y 二 exp(beta(1) 一 beta(2). /(x 十 beta(3))); % 以 beta 对 应 模型 参数 A, B,C， 
用 内 置 函 数 nlinfit 对 其 作 非 线性 拟 合 : 
t=[20 30 40 50 60 70 80 90]'; 
ps 一 [0. 02383 0. 04325 0. 07520 0. 12578 0. 20313 0. 3178 0. 4829 0. 7149]'; 
T=t+273; 
ps=ps* 760; 
y 一 psi 
FE 
beta0 一 [18. 6,4000, 一 40]; 
[beta,r,J]=nlinfit(x,y,'antoine', beta0); 
A=beta(1) 
B= beta(2) 
C=beta(3) 
plot(T,r,'r*') 
计算 得 到 :A = 18.49, B = 391 2，C = 一 42. 22, 并 输出 各 温度 下 的 残 差 图 。 
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第 五 节 ”最 优化 方法 及 MATLAB 优化 求解 


一 、 最 优化 简介 

事实 上 ,以 上 的 线性 回归 和 非 线性 回归 中 要 求实 验 数 据 的 残 差 平方 和 最 小 也 
是 最 优化 的 一 种 。 所 谓 最 优化 ,就 是 设法 使 需要 优化 的 目标 函数 取得 最 优 值 ( 最 小 
值 或 最 大 值 )。 在 最 优化 问题 中 ,最 经 典 的 数学 模型 可 表示 如 下 : 


(minf (x1, x2, ***, Tn) 
je Ta ra) 之 0 一 1，2，…，7 
h(xi, x2r Xs) 一 0, 7 一 1，2，…，m 
如 果 将 函数 用 向 量 形式 表示 : 
发 一 (zi Ta, Ta)T, G= (gi ger", gr)T, H= (Chi, hos ee, hm)T 
上 述 数 学 模型 可 以 简化 为 


min f(X), G(X) 过 0, H(X) = 0 


式 中 :函数 7 为 目标 函数 ,G 和 HH 则 称 为 约束 条 件 。 如 果 目 标 函 数 要 求 为 最 大 值 
问题 , 即 max f(X) ,可 以 令 F(X) 三 一 AX) ,从 而 将 数学 模型 转化 为 经 典 模型 。 

最 优化 问题 可 根据 所 讨论 问题 中 的 约束 条 件 进行 分 类 ,如 没有 出 现 约束 条 件 
的 则 称 为 无 约束 最 优化 问题 ;如 果 问 题 中 有 约束 条 件 的 则 称 为 约束 问题 。 如 果 变 
量 X. 与 时 间 变化 无 关 则 称 为 定常 问题 ;否则 称 为 非 定常 问题 。 而 具体 的 最 优化 求解 
方法 有 很 多 ,如 Powell 法 .牛顿 法 ,Gauss 法 .单纯 形 法 ` 线 性 规划 法 ` 动 态 规划 法 等 。 

一 般 来 说 ,以 上 的 最 优化 求解 均 是 采用 迭代 的 方法 实现 的 ,其 基本 思想 是 先 选 
择 一 个 估计 值 的 初 值 k”, 则 可 计算 目标 函数 F'” 二 FCk” ) 的 值 ,然后 沿 着 某 一 目 
标 函 数 下 降 的 方向 P" ,将 多 维 最 优化 问题 转化 为 一 维 最 优化 问题 。 进 行 一 维 搜 
索 , 找 到 一 个 新 的 k" 值 ,使 FV 二 F% ,这 个 k" 值 便 是 极 小 点 k* 的 第 一 次 迄 代 
近似 值 。 然 后 再 从 k， 出 发 , 沿 着 目标 函数 下 降 的 方向 PW” 继续 进行 搜索 , 依 此 得 
到 天 (2) 党 k's ys 天 ,使 其 满足 FY > FD > FEF? 2 as 六 下 同时 天 0) 和 大 本 
kK ,KG ，…， Ko 逐步 收敛 于 满足 目标 函数 正极 小 值 的 必 ”… ,其 迭代 公式 为 k"*? 一 
kK 十 思 ”” ,和 迭代 的 判别 依据 为 


Forb 一 Fm 一 e 


= 


For 一 Fo 


<e 


在 一 维 搜索 中 ,经 常 采用 黄金 分 割 法 (0. 618 法 ) 对 一 元 函数 寻找 最 优点 , 因 其 
计算 过 程 简单 ,计算 次 数 较 少 。 

对 于 生命 科学 及 生物 工程 的 研究 和 开发 ,一 个 重要 的 标志 是 除了 掌握 过 程 的 
各 个 特征 参数 外 ,还 必须 尽 最 大 的 可 能 ,了 解 所 有 对 过 程 进行 具有 重大 影响 的 因 
素 , 建 立 整个 系统 的 数学 模型 ,用 最 优化 的 方法 实现 过 程 的 最 佳 运行 , 求 得 各 个 参 
数 的 最 优化 ,对 生命 过 程 进行 模拟 ,借助 计算 机 解决 生命 科学 中 的 复杂 问题 。 


二 、MATLAB 在 优化 中 的 应 用 


MATLAB 除了 在 数值 分 析 、 统 计 学 中 的 应 用 外 , 还 能 用 于 最 优 设计 。 
MATLAB 的 优化 工具 箱 能 够 解决 各 种 不 同类 型 的 优化 问题 ,包括 以 上 的 典型 非 
线性 优化 问题 ,一 元 线性 回归 多 元 线性 回归 、 多 项 式 回归 等 最 小 二 乘法 问题 ,以 及 


非 方 程 方程 组 的 求解 等 。 工 具 箱 的 常用 函数 如 表 15 -6 所 示 。 


类 型 


一 元 函数 最 优化 
无 约束 极 小 化 


约束 极 小 化 


线性 规划 


二 次 规划 


极 大 极 小 问题 


线性 方程 组 


一 元 非 线性 方程 
非 方程 方程 组 





表 15-6 MATLAB 优化 工具 箱 的 主要 函数 








模 型 语 句 .m 文 件 
Minf(x) X=fminC f",x0) function {={(x) 
Minf(x) X=fminu( {"',x0) function {={(x) 

X 一 fmins( {',x0) function {f={(x) 
Minf(x) X=constr( {',x0) function [f,g]=f{(x) 
s. t. g(x)<0 
Min cTx X=lp(c, A,b) 
s.t. Ax<b 
Min x Hx/2+cT™x X=qp(H,c,A,b) 
st Ax<b 
Min(max {(x)) X 一 minimax( {", x0) function [f,g]={(x) 
Ss.1. g(x)<O 
AX=b X=A/b 
F(a)=0 A=f{zero( f',a0) function y={(x) 
F(x)=0 X= {solveC F',x0) function y={(x) 
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( 续 表 ) 








类 型 模 型 语 句 .m 文 件 
线性 最 小 二 乘 Min | Ax—bll? X=A/b 
非 线性 最 小 二 乘 | Min fT (xf (x) X=leastsq( {',x0) function {={(x) 
X=1sqcurvefit( {', x0) function {={(x) 
非 负 线 性 最 小 二 乘 | Min | Ax 一 如 | X=nnls(A,b) 
s. t. x>0 
约束 线性 最 小 二 乘 | Min || Ax 一 6b 1 X=conls(A,b,C,d) 
st Cx<d 
非 线 性 最 小 二 乘 | Min1/2 ‖ F(x, xdata) 一 | X= lsqcurvefit(' ff', x0, | function {= f(x, 
曲线 拟 合 ydata ||? xdata, ydata) xdata) 














下 面 以 非 线 性 最 小 二 乘 曲线 拟 合 为 例 ,说 明 MATLAB 的 求解 过 程 。 在 模型 
Min1/2 F(x,， xdata) 一 ydata | * 中 , 即 假设 已 知 的 实验 数据 xdata，ydata 均 是 nn 


维 向 量 。 两 者 的 关系 为 
ydata=F(x, xdata) 


式 中 :x 是 待定 的 模型 参数 (也 是 向 量 )。 
试 求 参数 x, 使 其 满足 目标 函数 : 


Min1/2 | PCxvaxdata) 一 ydata | 一 BMin[ > CF(xadarai) — ydatai)’ ] 
i=1 


函数 lsqcurvefit 求解 非 线性 最 小 二 乘 曲线 拟 合 是 采用 Levenberg - Marquardt 

法 或 Gauss - Newton 法 ,其 常用 的 调用 格式 为 
x 一 1sqcurvefit(' f', x0, xdata, ydata) 

或 x=lsqcurvefit(' f', x0, xdata, ydata, options) 
式 中 :x0 为 待定 的 模型 参数 向 量 的 初 值 , xdata 和 ydata 为 已 知 的 实验 数据 ， 
options 为 参数 控制 向 量 。 

[ 例 15-4] 设 某 一 药物 的 成 本 计算 模型 为 y = a 十 be™，, 式 中 工 为 药物 产 
量 , 已 知 数据 如 表 15 - 7 所 示 。 

表 15-7 [ 例 15-4]J 已 知 数据 

600 | 700 | 800 | 900 | 1000 





时 100 200 300 400 














628 603 580 558 538 








y 784 | 751 | 718 | 685 





试 以 最 小 二 乘法 估计 模型 参数 。 
首先 编写 M 文件 funl. m， 


= 


function {=funl(x, xdata) 
f=x(1)+x(2) * exp( 一 x(3) * xdata); 
为 了 调试 方便 ,也 可 以 将 数据 语句 等 编写 成 M 文件 , 取 名 为 youhua. m， 
xdata 一 [100,200,300,400,500,600,700,800,900,1000]; 
或 者 
xdata= linspace(100, 1000,10); 
ydata=[784,751,718,685,658,628,603,580,558,538]; 
x0=[240,560,0. 0005]; 
x= lsqcurvefit(' funl ', x0, xdata, ydata) 
yl=funl(x, xdata) 
plot(xdata, ydata,' k++') 
hold 
plot (xdata, yl,' k—') 
e=ydata—funl(x, xdata) 
sum(e. * e) 
在 命令 窗口 中 输入 youhua, 即 可 得 到 如 下 结果 : 
x= 235.7914 587. 5089 0. 0007 
yl 一 785.3662 749.8813 716.6876 685.6372 656.5916 629. 4214 
604.0056 580.2308 557.9911 537.1873 
e 一 一 1.3662 1. 1187 1.3124 ”一 0.6372 1.4084 ”一 1.4214 
一 1. 0056 ”一 0. 2308 0. 0089 0. 8127 
sum 一 10.9753 
MATLAB 也 可 以 将 回归 的 结果 以 图 的 形式 更 直观 地 表示 出 来 ,如 图 15 - 5 
所 示 。 








s00L 。 Pm 
100 200 300 400 500 600 700 800 900 1 000 
图 15-5 回归 结果 示意 
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其 他 模型 的 计算 过 程 详 见 MATLAB 说 明 。 


本 章 学 习 要 点 : 
(1) 了 解 非 线性 方程 的 线性 化 方法 。 


(2) 了 解 非 线性 回归 的 模型 检验 ,特别 是 残 差 检 验 。 


(3) 应 用 MATLAB 计算 非 线性 方程 组 。 
(4) 应 用 MATLAB 计算 非 线 性 回归 。 


=“ 


第 十 六 章 “ 生命 科 学 实验 设计 


第 一 节 ”实验 设计 概述 


科学 研究 和 实验 工作 总 是 要 投入 大 量 的 人 力 物力。 现代 科学 技术 的 实验 研 
究 不 仅 需 要 及 时 更 新 实验 仪器 和 设备 ,还 需 不 断 提高 科研 人 员 的 技术 素质 。 这 对 
研究 者 进行 实验 研究 的 规划 ,提出 了 更 高 的 要 求 和 新 的 挑战 。 实 验 设计 作为 一 种 
通用 的 研究 方法 ,向 科研 工作 者 展示 了 用 科学 方法 来 进行 科学 实验 的 思想 和 方法 。 
所 谓 实验 设计 ,就 是 在 实验 过 程 实施 之 前 ,实验 者 对 实验 过 程 所 进行 的 一 系列 的 选 
择 、 组 织 和 决策 ,对 实验 过 程 的 优化 设计 。 实 验 设计 的 基本 宗旨 是 最 大 限度 地 提高 
实验 效率 ,减少 实验 次 数 和 最 大 限度 地 提高 实验 精度 。 随 着 生命 科学 研究 的 深入 
和 研究 范围 的 拓宽 ,生命 科学 的 研究 手段 越 来 越 多 ,研究 所 用 仪器 越 来 越 精密 , 需 
测试 的 数据 也 越 来 越 多 ,有 关 的 研究 和 开发 的 竞争 越 来 越 激烈 。 生 命 科 学 的 实验 
人 员 迫 切 需 要 改进 工作 方法 ,改革 以 往 的 经 验方 法 ,提高 科研 效率 ,以 便 以 较 少 的 
代价 获得 满意 的 效果 。 


一 、 实 验 设计 的 性 质 和 价值 


一 项 优秀 的 实验 设计 ,能 够 以 最 少 的 实验 工作 量 取 得 所 需 的 数据 或 资料 ,获得 
最 有 用 的 信息 。 因 此 ,必须 满足 以 下 的 三 点 :必须 正确 地 列 出 实验 目的 ,明确 通 
过 实验 要 解决 的 问题 ;@ 必 须 在 兼顾 所 希望 的 各 项 实验 内 容 下 ,选择 最 少 的 实验 内 
容 或 实验 项 目 ;@ 必 须 正确 选择 实验 的 数据 模型 和 正确 处 理 数据 ,明了 历次 实验 各 
参数 的 数量 、 变 化 关系 及 相互 之 间 关系 。 实 验 设 计 的 统计 理论 所 论述 的 就 是 这 种 
包括 在 一 组 实验 观测 值 中 各 项 数据 的 数目 及 其 相互 关系 的 一 般 模 型 。 利 用 数学 理 
论 获 得 一 个 实验 方案 所 提供 资料 的 定量 结果 ,然后 用 它 与 不 同 的 方案 进行 对 比 ,以 
评价 它们 对 任 一 给 定 项 目的 适用 性 ,从 定量 角度 说 明 实 验 设 计 的 合理 性 。 通 过 这 
类 研究 ,加 上 运用 它们 所 取得 的 实验 经 验 , 实 验 设计 已 经 发 展 成 为 一 门 涉及 各 种 类 
型 实验 工作 的 学 科 , 用 来 指导 科技 人 员 从 中 选择 出 适合 于 特定 项 目的 设计 。 

实验 设计 不 仅 可 以 指导 实验 过 程 ,还 可 以 减少 实验 误差 ,提高 实验 的 精确 度 。 
统计 学 的 作用 是 提供 各 项 判 据 , 使 研究 人 员 可 据 以 判断 所 建议 的 某 项 设计 的 效率 ， 
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并 为 他 们 提供 一 些 经 过 理论 和 实践 证 明了 的 、 对 处 理 某 些 类 型 的 问题 特别 有 效 的 
某 种 标准 设计 模型 。 用 统计 方法 设计 实验 的 一 个 附带 好 处 是 ,迫使 研究 人 员 在 运 
目 统 计 方 法 时 必须 预先 考虑 他 们 在 寻求 哪些 目标 ,考虑 哪些 实验 参数 ,以 及 必须 采 
哪些 步骤 去 探索 这 些 目 标 ,确定 这 些 参数 。 此 外 ,还 迫使 他 们 考虑 所 有 可 能 产生 
的 ,不 同 来 源 的 误差 大 小 。 这 种 先期 的 考虑 本 身 就 具有 重大 价值 ,因为 这 样 往往 能 
够 引导 研究 人 员 认 识 到 并 从 而 回避 实验 过 程 可 能 出 现 的 难点 和 失误 。 反 过 来 讲 ， 
如 果 不 这 样 设计 ,这 些 实验 难点 或 失误 可 能 在 研究 工作 的 后 期 出 现 , 由 此 将 产生 严 
重 的 后 果 。 

通过 一 些 实验 设计 ,可 以 缩小 在 实验 中 人 力 所 不 能 控制 的 偶然 性 误差 ,避免 各 
种 系统 误差 对 实验 的 干扰 。 


二 、 实 验 数据 的 设计 


生物 学 的 试验 要 求实 验 目 的 明确 ,实验 条 件 具 有 代表 性 ,实验 结果 具有 可 靠 
性 ,而 且 结 果 应 有 重复 性 。 按 照 要 求 ,传统 的 实验 过 程 是 按照 实验 目的 安排 实验 因 
子 和 实验 条 件 一 次 性 完成 实验 任务 ,然后 对 实验 数据 进行 分 析 和 整理 , 比较 注重 对 
实验 数据 的 数量 和 正确 性 的 追求 ,而 较 少 考虑 实验 点 的 安排 和 布置 。 其 特点 是 数 
据 的 产生 和 数据 处 理 是 分 阶段 的 ,实验 安排 是 主观 的 、 先 验 的 。 实 验 设计 是 一 门 近 
代 发 展 起 来 的 新 兴 交 叉 学 科 , 是 以 数学 模型 为 基础 ,了 解 变量 选择 的 范围 ,确定 实 
验 点 位 置 的 一 种 方法 ,把 实验 安排 在 最 有 效 的 范围 内 ,因为 不 同 的 实验 点 位 置 在 
总 体 设计 上 的 作用 是 不 相同 的 ,不 同 的 实验 点 所 提供 的 实验 信息 是 不 一 样 的 。 
实验 设计 已 不 再 局 限于 被 动 地 处 理 实验 数据 ,而 是 主动 地 选择 实验 方法 和 实验 

根据 实验 设计 的 过 程 ,常用 的 科学 实验 数据 设计 一 般 可 分 为 正 交 实验 设计 和 
序 贯 实验 设计 ,其 他 较为 简单 的 有 对 比 设计 (包括 单 因素 方差 分 析 和 双 因 素 方差 分 
析 )、 随 机 区 组 设计 ,拉丁 方 设计 等 。 

传统 的 实验 过 程 结 合 实验 点 的 正 交 安排 和 特定 的 数据 处 理 方式 , 即 为 正 交 实 
验 设计 。 而 运用 已 有 的 资料 进行 实验 设计 ,确定 必要 的 试验 和 进一步 试验 的 次 数 ， 
这 种 利用 一 系列 观测 中 先前 部 分 获得 的 资料 ,设计 其 后 的 工作 , 称 为 对 一 个 问题 的 
序 贯 分 析 。 其 最 简单 的 形式 是 , 先 做 一 次 小 规模 实验 ,取得 关于 误差 或 效果 的 一 般 
资料 ,然后 再 利用 这 些 资料 去 设计 整个 实验 。 如 果 系 统 地 运用 序 贯 分 析 , 其 优越 性 
更 为 显著 。 

本 章 将 对 对 比 设计 、 序 贯 实验 设计 作 简单 介绍 ,主要 介绍 正 交 实验 设计 和 回归 
正 交 设 计 。 
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第 二 节 ” 单 因 素 设计 和 双 因 素 设计 


一 、 单 因素 设计 试验 

单 因 素 设 计 试 验 (single - factor experiment) 是 指 整个 试验 中 只 比较 一 个 试验 
因素 的 不 同 水 平 的 试验 ,研究 该 因素 对 试验 结果 有 无 显著 影响 。 单 因素 试验 方案 
由 该 试验 因素 的 所 有 水 平 构成 ,这 是 最 基本 、 最 简单 的 试验 方案 。 例 如 在 培养 基 中 
添加 4 种 剂量 的 某 抗 菌 素 , 进 行 抑 菌 试验 ,就 是 一 个 有 4 个 水 平 的 单 因素 试验 , 添 
加 某 抗菌 素 的 4 种 剂量 , 即 该 因素 的 4 个 水 平 构成 了 试验 方案 ,其 中 各 个 水 平 的 试 
验 可 多 次 重复 。 

m 个 水 平 , 各 次 重复 实验 的 单 因 素 试验 数据 如 表 16 - 1 所 示 。 

表 16-1 单 因 素 试验 数据 表 








作 方差 分 析 : n 一 mwX7, 列 平均 ,一 上 > zy ,总 平均 :一 六 了 zy。 


i=1 











总 离 差 平方 和 : Sr = 了 六 Cr 一 一 六 六 二 一 工本 
1 二 1 j=1 


i=l j=l 


组 内 平方 和 (误差 平方 和 ): Se 一 》) 了 (nr 一 去 .一 Sr 一 Sh, 随 机 因素 的 影响 。 


组 间 平 方 和 (因素 平方 和 ) :SA 一 r (Zz 一 2, 水平 差异 的 影响 。 


构造 方差 表 参 见 表 16 - 2。 
表 16-2 方差 表 








方差 来 源 平方 和 [自由 度 | 均 广 比值 显著 性 
因素 A 的 影响 (组 间 ) SA |m—l| WA=SA/(m 一 1) FF 
F=Va/Vs 
误差 下 的 影响 (组 内 ) | Se | 一 m| Ve=Se/(n-m) 显著 
总 和 s | nl 
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[ 例 16-1] 考察 某 酶 反应 温度 对 产物 合成 产 率 的 影响 ( 见 表 16 - 3)。 
表 16-3 温度 对 合成 产 率 的 影响 


温度 / 必 区 | 32 | 37 








采用 Matlab 单 因素 方差 分 析 语 句 :anoval。 
格式 :p 一 anoval(X) ,比较 各 列 均值 ,输出 零 假 设 存在 下 的 概率 。 
输入 X=[45 42 46 44 43; 51 50 48 52 51; 54 55 52 50 48; 54 58 57 60 58]; 
anoval(X) 
ans 二 
3.5397e- 007 
该 概率 远 远 小 于 0. 05, 故 影响 显著 。 
结果 还 输出 方差 表 、 箱 形 图 两 个 图 表 , 显 示 对 应 的 方差 计算 结果 和 各 列 均值 差 
异 ( 见 图 16-1.、 图 16 -2)。 





图 16-1 方差 计算 结果 








1 4 


3 
Column Number 
16 -2 ANOVAI 的 计算 图 表 


=a 


二 、 双 因素 设计 试验 

在 实际 科研 工作 中 ,常常 同时 研究 两 个 因素 对 实验 结果 的 影响 ,如 反应 温度 和 
反应 时 间 对 结果 的 影响 ,需要 对 两 个 因素 作 方差 分 析 , 了 解 各 因素 对 实验 结果 的 显 
著 程度 。 其 方差 分 析 过 程 和 单 因 素 方差 分 析 相 似 。 

设计 A、B 两 个 因素 ,因素 A 取 a 个 水 平 ,因素 B 取 5 个 水 平 ,进行 n 二 
实验 。 

双 因 素 试验 数据 表 如 下 : 

表 16-4 双 因 素 试验 数据 

B， B, | … B, 


ap 次 








作 方差 分 析 : n 一 a。b, 行 平均 : 世 一 过 了 zo, 列 平均 := 二 zy。 
i=!1 i=l 
总 平均 = 了) Dzy。 


总 高 差 平方 和 :Sr 一 六 六 Cn 一 2 一 袜 站 三 一 7 


i1 j=l i=1 7=1 








组 间 平方 和 (A 因素 平方 和 ) :SA 一 5 (z, 一 二 )2，A 水 平 差异 的 影响 。 
i=] 


组 间 平 方 和 (B 因素 平方 和 ): Se 一 a 2 (z.; 一 工 )*，B 水 平 差异 的 影响 。 











误差 平方 和 :Se Do 元 .一 2 十 I)? 一 Sr 一 SA 一 Sa; 随机 因素 的 影响 。 
构造 方差 表 参 见 表 16 - 5。 


表 16-5 方差 表 






















Ee 方差 来 源 平方 和 | 自由 度 均 方 | 比值 显著 性 
因素 A 的 影响 | SA |a-l WA 一 SA/(a 一 1) FoVa/Ve | 记忆 
因素 B 的 影响 | Se | 一 1 Va—=Sa/(b—1) F=Va/VE 显著 
误差 下 的 影响 (Ce 一 DG 一 1D) | YE 一 Se/(a 一 DG 一) 

总 和 2 一 1 
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[ 例 16-2] 研究 4 种 瘦 肉 精 分 析 方法 (A) 的 差异 ,选取 5 种 不 同 污染 猪肉 样 
本 (B) ,数据 如 表 16 - 6 所 示 : 
表 16-6 瘦 肉 精 分 析 








采用 Matlab 双 因 素 方 差分 析 语 句 :anova2。 
格式 :p 王 anova2(X,reps) ,比较 各 行 , 各 列 数据 的 均值 , reps 参数 表示 各 观测 
值 标号 (重复 试验 的 次 数 ) 。 
输入 X 一 [0.07 0.45 0.11 0.16 0.84; 0. 10 0. 37 0. 14 0. 12 0. 90; 0. 13 0. 42 
0. 05 0. 13 0. 94; 0. 13 0. 43 0. 08 0. 08 0. 88]; 
anova2(X) 
ans 一 
0. 0000 0. 9541 
该 概率 显示 不 同 猪肉 样本 影响 显著 ,不 同 分 析 方 法 无 显著 差异 。 
结果 还 输出 方差 表 ,显示 对 应 的 方差 计算 结果 和 各 列 均值 差异 ( 见 图 16 - 3) 。 


ANOVA Table 





图 16-3 方差 计算 结果 


对 于 双 因素 试验 ,每 个 试验 可 重复 进行 ,这 时 即 为 双 因素 重 复试 验方 差分 析 。 

在 实际 应 用 中 ,一 个 试验 结果 (试验 指标 ) 往 往 受 多 个 因素 的 影响 。 不 仅 这 
些 因素 会 影响 试验 结果 ,而 且 这 些 因素 的 不 同 水 平 的 搭配 也 会 影响 试验 结果 。 
这 时 需要 进行 多 因素 试验 。 多 因素 试验 是 指 在 同一 试验 中 同时 研究 两 个 以 上 试 
验 因 素 的 试验 。 多 因素 试验 方案 由 该 试验 的 所 有 试验 因素 的 水 平 组 合 ( 即 处 理 ) 
构成 ,分 为 完全 方案 和 不 完全 方案 两 类 。 多 因素 的 分 析 研 究 , 用 正 交 试验 法 比较 
方便 。 

统计 学 上 把 多 因素 不 同 水 平 搭配 对 试验 指标 的 影响 称 为 交互 作用 。 交 互 作用 
在 多 因素 的 方差 分 析 中 ,也 把 它 当 成 一 个 新 因素 来 处 理 。 





0 


三 、 主 成 分 分 析 ( 主 因素 分 析 ) 


在 实际 课题 中 ,为 了 全 面 分 析 问 题 ,往往 提出 很 多 与 此 有 关 的 变量 (或 因素 )， 
因为 每 个 变量 都 在 不 同 程度 上 反映 这 个 课题 的 某 些 信息 。 但 因素 很 多 ,并 且 因 素 
之 间 可 能 存在 一 定 的 相关 性 ,分 析 复 杂 。 为 简化 分 析 , 经 常 需要 确定 影响 结果 的 主 
要 因素 。 主 因素 分 析 也 称 为 主 成 分 分 析 (Principal Component Analysis，PCA)， 
是 一 种 将 多 个 变量 通过 线性 变换 以 选 出 较 少 的 重要 变量 的 多 元 统计 分 析 方 法 , 常 
用 于 生物 复杂 系统 中 的 归 类 分 析 。 主 成 分 分 析 首 先是 由 K. 皮尔 森 (Pearson， 
1901) 对 非 随机 变量 引入 的 ,尔后 H. 霍 特 林 (Hotelling，1933) 将 此 方法 推广 到 随 
机 向 量 的 情形 。 信 息 的 大 小 通常 用 离 差 平方 和 或 方差 来 衡量 。 

主 成 分 分 析 通 过 降 维 技术 把 多 个 变量 化 为 少数 几 个 主 成 分 ( 即 综合 变量 ) 的 统 
计 分 析 方 法 ,对 于 原先 提出 的 所 有 变量 ,建立 尽 可 能 少 的 新 的 综合 变量 ,使 得 这 些 
新 变量 是 两 两 不 相关 的 ,而 且 这 些 新 变量 在 反映 课题 的 信息 方面 尽 可 能 保持 原 有 
的 信息 。 在 通常 情况 下 ,前 几 个 主 成 分 的 方差 之 和 将 超过 初始 数据 方差 总 和 
的 80%。 


四 、MATLAB 中 的 试验 设计 


MATLAB 统计 工具 箱 中 提供 了 一 些 不 同情 况 下 的 试验 设计 语句 ,主要 是 全 
因素 试验 和 不 完全 因素 试验 。 下 面 介 绍 两 种 全 因素 试验 : 
1， ff2n: 二 级 (水 平 ) 全 因素 试验 
如 3 因素 2 水 平 试验 ,ff2n(3) 


ans 一 





二 一 品 吕 oo 
二 口 口 一 上 口 口 
王 口 一 口 一口 一 口 


1 1 
2. fullfact: 混 合 水 平 全 因素 试验 
如 1 因素 4 水 平 ,1 因素 3 水 平 全 因素 试验 ,fullfact([4,3]) 


ans 一 
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第 三 节 ” 正 交 实验 设计 


一 、 正 交 实 验 设计 的 原理 


正 交 实验 设计 的 特点 是 在 等 概率 的 条 件 下 ,比较 各 个 变量 对 要 求 的 实验 值 的 
影响 。 通 过 特定 的 极 差 分 析 和 方差 分 析 将 各 个 变量 的 变化 对 要 求 的 实验 值 的 误差 
影响 进行 比较 ,来 确定 各 个 变量 的 作用 是 否 显著 ,以 及 各 个 变量 的 合适 的 变化 范 
围 。 由 于 正 交 设计 是 在 等 概率 的 条 件 下 安排 实验 点 ,不 需要 固定 其 他 变量 即 可 改 
变 某 个 变量 进行 一 组 实验 , 它 可 以 大 大 减少 实验 
的 数目 。 1 2 3 

正 交 实验 设计 是 在 拉丁 方 和 正 交 拉 丁 方 设计 
的 基础 上 发 展 而 来 的 。N 阶 拉丁 方 是 n Xn 的 方 
阵 , 它 最 初 是 应 用 在 农业 研究 的 一 种 均匀 、 随 机 化 
试验 ,例如 研究 3 个 品种 的 小 麦 (A, B, C) 在 不 同 南 3 
区 域 的 产量 的 试验 ( 见 图 16 -4) ,考虑 到 土壤 的 差 i 
异 , 按 不 同 走向 划分 试验 区 域 。 它 要 求 列 随机 、 行 A 品 
随机 、 处 理 随机 。 人 

如 三 阶 拉丁 方 和 四 阶 拉丁 方 分 别 为 

三 阶 拉 丁 方 四 阶 拉 丁 方 
ABC ABCD 








“= 


CG 


拉丁 方 中 的 每 个 符号 在 列 或 行 中 只 出 现 一 次 。 拉 丁 方 设计 是 随机 化 完全 区 组 
设计 的 推广 。 拉 丁 方 设计 的 统计 模型 是 


zy(k) =p+tatB+r te lk) (ijr k=1,2,.,m) 


式 中 ; Da = 3B = Dr =0,6j(k) ~ N(0, 0 ), a, Br 分 别 是 第 i 行 ,第 
了 列 及 第 & 个 处 理 的 效应 。 
拉丁 方 设计 由 于 其 特殊 的 行列 安排 ,其 优点 是 可 以 大 大 减少 实验 次 数 。 如 对 
于 三 阶 拉 丁 方 按 3 个 因子 计划 ,只 要 试验 9 次 ,假设 各 个 因子 需要 考虑 3 个 水 平 ， 
则 需要 27 次 。 
把 两 个 彼此 独立 的 拉丁 方 释 合 起 来 , 称 为 正 交 拉丁 方 。 如 两 拉丁 方 分 别 为 
ABC a B 7 
BCA YaB 
C A B B 7 a 
新 的 正 交 拉丁 方 为 
Aa BB Cy 
By Ca AB 
CB Ay Ba 


将 正 交 拉丁 方 列 成 表格 和 数字 形式 , 即 可 得 到 正 交 表 ,从 而 可 以 解决 多 因子 试 
验 问题 。 

事实 上 ,对 于 同时 实验 的 方案 ,全 面 实验 是 实验 设计 中 最 为 简单 的 一 种 , 它 可 以 
清楚 地 把 实验 规律 剖析 明白 。 但 是 当 影 响 实验 的 因素 较 多 时 ,各 个 因素 和 其 水 平 相 
组 合 , 实 验 次 数 非 常 庞大 。 如 三 因子 二 水 平 ,需要 实验 2 二 8 次 ;五 因子 三 水 平 ,需要 
实验 3 一 243 次 ;而 十 因子 三 水 平 , 则 需要 实验 3” = 二 59 049 次 ,因此 许多 时 候 , 实 现 这 
样 的 实验 方案 是 不 可 能 的 ,也 是 不 现实 的 。 正 交 实 验 设计 是 利用 正 交 表 安 排 多 因素 
实验 ,并 进行 实验 结果 分 析 的 科学 方法 。 它 从 众多 的 实验 中 挑选 出 一 部 分 具有 代表 
性 的 、 分 散 的 实验 条 件 去 作业 ,使 其 实验 结果 具有 均衡 分 散 、 整 齐 有 序 的 特点 。 正 交 
实验 对 全 体 因 素来 说 是 部 分 实验 ,但 是 对 于 因素 中 的 任何 两 个 来 说 是 全 面 实验 。 正 
交 实 验 设计 既 克 服 了 全 面 实验 的 实验 次 数 过 多 的 缺点 ,又 能 保持 充分 了 解 实验 规律 
的 特点 。 正 交 实 验 设计 是 生命 科学 中 科学 实验 的 一 种 有 力 工 具 。 
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常用 的 正 交 表 的 形式 如 下 面 的 Li, (2)，Ls(2 ) 表 所 示 ( 见 表 16 - 7)。 以 
Ls (2 ) 表 为 例 说 明正 交 表 的 特点 ,L 表示 正 交 表 ;8 表示 实验 号 , 即 所 需 的 实验 次 
数 ;7 表示 因子 或 因素 的 数目 , 即 用 该 正 交 表 安排 实验 ,最 多 可 考察 7 个 因子 ;2 表 
示 被 考察 的 因子 要 求 的 实验 水 平 为 2。 按照 正 交 实 验 设计 ,七 因子 二 水 平 , 只 需要 
实验 8 次 , 相 比 全 面试 验 要 实验 128 次 ;四 因子 三 水 平 , 按 正 交 表 只 需要 实验 9 次 ， 
相 比 全 面试 验 要 实验 81 次 。 正 交 实 验 设计 可 以 大 大 减少 达到 同样 实验 目的 的 实 
验 次 数 。 











表 16-7 常用 的 正 交 表 
(1) L(23) 





1 
2 
3 
4 


(2) La(2’) 






7 

















2 
1 
1 
2 
2 
1 
1 
2 


还 有 一 种 混合 水 平 的 正 交 表 ,由 两 组 不 同 的 影响 因子 及 实验 水 平 所 组 成 ,可 以 
用 于 多 因子 及 不 同 水 平 的 实验 使 用 。 如 Lis (6' X35), 它 表示 实验 次 数 为 18 次 , 实 
验 由 1 个 6 水 平 的 因子 和 6 个 3 水 平 的 因子 组 成 。 

具体 的 正 交 表 选 用 ,要 根据 因子 的 个 数 和 要 考察 的 交互 作用 因子 的 个 数 而 定 。 
特别 是 多 因子 有 交互 作用 的 正 交 实验 设计 要 复杂 得 多 ,其 中 最 突出 的 要 求 是 必须 
按照 一 定 的 规则 安排 各 因子 在 正 交 表 上 的 列 位 顺序 。 其 具体 的 正 交 实 验 步 又 与 无 
正 交 交互 作用 的 正 交 实验 没有 明显 的 不 同 。 但 是 在 有 交互 作用 的 正 交 实 验 设计 
中 ,必须 遵守 一 因子 占据 一 列 的 原则 ,如 果 由 于 列 数 不 够 因子 分 配 , 宁 要 选用 规模 
较 大 的 正 交 表 , 也 不 允许 因子 共 列 的 现象 ,否则 必然 会 产生 数据 混杂 。 如 试验 中 有 
四 个 主要 因子 A, B,C, D; 其 中 因子 之 间 可 能 存在 交互 作用 ,选择 Ls(2 ) 安 排 试 
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验 , 可 以 得 到 如 表 16 - 8 所 示 的 设计 。 
表 16-8 实验 表 头 设计 
AxXB | 6 | AxC AXD | 





设计 | A 本 CxD BxD BxC 











列 号 | 1 2 3 4 | 5 6 7 





通过 分 析 后 ,不 仅 可 以 了 解 哪个 因子 起 主要 作用 ,还 可 了 解 那些 因子 之 间 存 在 
相互 作用 。 


二 、 正 交 实 验 设计 的 步骤 


利用 正 交 表 设计 实验 方案 的 过 程 ,可 用 下 例 进行 说 明 。 

[ 例 16-3] 某 生 化 实验 室 用 生物 合成 的 方法 ,试制 生物 体 磷 脂 代谢 的 前 
体 一 一 胞 二 磷 胆 大 (CDP - C) , 它 是 治疗 大 脑 损伤 引起 的 意识 障碍 的 生化 药物 。 因 
为 以 前 的 工艺 流程 的 产物 转化 率 较 低 , 故 希望 通过 正 交 试 验 得 到 满意 的 发 酵 条 件 ， 
提高 产物 的 转化 率 。 

利用 正 交 表 设计 实验 方案 的 步骤 是 : 

1， 先 挑选 合适 的 影响 因素 和 各 个 因素 的 水 平 

根据 以 往 的 实验 ,及 将 生物 反应 理论 上 的 分 析 研 究 作 为 参考 。 从 可 能 影响 产 
物 转化 率 的 各 个 因素 中 找到 了 酵母 量 .pH、 磷 酸 缓冲 液 浓度 .葡萄糖 浓度 、 磷 酰 胆 
碱 浓 度 .反应 液体 积 . 甲 葵 用 量 等 7 个 因素 为 主要 影响 因素 。 并 在 每 个 因素 上 选 了 
两 个 水 平 。 将 因素 水 平 列 人 因素 水 平 表 ( 见 表 16 ~ 9) 。 

表 16-9 [ 例 16-3] 的 因素 水 平 表 

















| C 伙 酸 组 | 5 区 村 炎 EE 大 酰 胆 硕 G 甲 蒜 

| F 

| 串 液 浓度 |。 深度 浓度 | 用 量 

| a /Cpmol/mL)| /Cpmol/ml,) /% 
600 50 20 0 
800 80 10 2 








2. 选 正 交 表 

根据 上 面 制定 的 因素 水 平 表 和 正 交 表 的 意义 ,选择 一 个 合适 的 正 交 表 。 由 于 
本 试验 的 实验 因素 为 7 个 ,实验 水 平 为 2 个 ,可 以 选择 的 正 交 表 有 Ls (2’), Liz (2")， 
Ls(2") ,等 等 。 但 是 对 于 一 般 实 验 条 件 的 筛选 .以 Ls(27) 较 为 理想 .较为 简洁 。 

3. 填 正 交 表 

把 实验 方案 中 的 各 个 因素 和 水 平 按照 顺序 填 人 实验 正 交 表 ( 见 表 16- 10) 。 
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表 16- 10 实验 正 交 表 






































因 珊 C 磷酸 组 E 磷 酰 F 反 应 |G 甲 莱 
六 卫生 最 | B- pH | 。 冲 液 波 度 “| 葡萄 缚 站 席 朋 碱 法 度 | 液体 积 | 用 量 | 转化 率 
人 2 | mom | /CamolmLD)| /mL | /% | 
试验 全 3 5 6 | 7 
1 | lzoo) |108.0| 13o0) 2(800) 2(80) | 1(20) | 2(20) | 11 
2 | zdo) | 1 2(200) 2 1(50) 1 | lo | 4 
§ 1 |20.5) 2 | 2 2 2010) | 1 | 56 
4 2 2 1 2 1 2 2 | 33 
5 1 1 2 1(600) 1 2 2 | 19 
6 2 1 1 1 2 2 1 | mo 
7 1 2 1 1 1 1 | a 
8 2 2 2 1 2 1 2 | 13 
二 上 
Ki = 水 刑 。 127 130 145 133 133 105 | 198 | 总 和 
1 之 和 一 273 
K, = 水 平 146 143 128 140 140 168 75 
2 之 和 
极 差 尺 二 19 13 17 A 7 63 123 
和 一 
K,| 
注 : 表 中 ( ) 内 数字 为 各 因子 所 取 的 水 平 。 
4. 进行 实验 
严格 按照 正 交 表 进行 实验 ,并 把 实验 结果 填 入 表 内 。 
5. 结果 分 析 


对 实验 结果 进行 分 析 , 计 算 各 个 因子 的 极 差 ,如 表 16 - 10 所 示 。 极 差 R 用 来 衡 
量 各 个 因子 在 实验 中 所 起 作用 的 大 小 ,R 越 大 表示 该 因子 的 不 同 水 平 对 实验 结果 的 
影响 越 大 。 本 例 的 影响 因子 的 重要 程度 按 极 差 大 小 排列 , 即 为 C->F-~A-~~C-~B->D， 
E。 水 平 的 影响 程度 则 为 G，1->F，2 一 A，2-~C,，1-~B,，2-~D,， 2 和 EE, 2。 根 据 以 上 
的 信息 ,可 以 得 到 实验 的 较 佳 条 件 , 并 在 该 条 件 下 进行 验证 。 一 般 来 说 ,这 个 实验 条 
件 是 较为 理想 的 。 但 是 这 个 实验 条 件 并 不 能 说 是 最 佳 条 件 ,因为 正 交 试验 时 挑选 的 
因子 水 平 不 一 定 是 最 理想 的 。 因 此 ,在 实验 要 求 比较 高 的 情况 下 ,可 以 在 所 得 到 的 正 
交 实验 条 件 基础 上 , 作 进 一 步 的 实验 设计 ,从 而 得 到 更 好 的 实验 结果 。 

仍 以 上 述 例 子 为 例 , 说 明 在 确定 了 重要 影响 的 因子 和 水 平 后 ,以 上 述 实验 条 件 
为 基础 ,再 进行 第 二 次 的 正 交 设计 。 首 先 认 为 G( 甲 莱 用 量 ) 可 能 是 最 佳 用 量 , 不 作 
变化 ,并 固定 其 他 几 个 变化 不 显著 的 因子 和 水 平 ,从 各 个 因素 中 取 下 , A, C 等 3 个 
子 , 即 酵母 量 、\pH\ 反 应 液体 积 等 3 个 因素 ,再 补 上 一 个 从 实验 中 新 产生 的 可 能 
影响 结果 较 大 的 因子 , 即 反 应 时 间 。 并 在 每 个 因素 上 选 了 3 个 水 平 ,各 个 水 平 是 以 
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上 面 挑选 的 水 平 为 基础 进行 设 定 的 。 选 用 正 交 表 Lo (34) ,将 因子 水 平 列 人 因子 水 
平 表 ,并 进行 方案 的 实施 ( 见 表 16 - 11)。 
表 16-11 第 二 次 正 交 实验 和 结果 
































因素 A-pH B 反 应 时 间 C 酵母 量 F 反应 液体 积 | 转化 率 
试验 号 /h | /VCmg/mL) /mL /% 
1 1(8.0) 1(24) 3(500) 2(8) 79 
2 2(7.5) 4 1(300) 1(10) 68 
3 3(7.0) 1 2(400) 3(6) 59 
4 1 2(18) 2 1 73 
5 1 3 3 68 
6 3 2 1 2 55 
7 1 3(12) 1 3 18 
8 2 3 2 2 47 
9 3 3 3 1 64 
Ki 一 水 平 1 之 和 170 206 141 205 总 和 二 531 
Ki 二 水 平 2 之 和 183 196 179 181 
K; 一 水 平 3 之 和 178 129 211 145 
极 差 R= 13 77 70 60 
| max 一 min| 
从 以 上 的 实验 结果 可 以 看 到 ,第 二 次 的 转化 率 基本 上 好 于 第 一 次 ,而 且 最 高 的 
转化 率 达 到 79%。 和 第 一 次 的 实验 结果 分 析 一 样 ,可 得 到 重要 的 影响 因子 和 影响 


水 平 ,并 为 进一步 的 实验 创造 条 件 。 如 有 需要 ,可 以 进行 再 一 次 的 实验 设计 。 

以 上 所 介绍 的 是 正 交 实验 设计 的 直观 ( 极 差 ) 分 析 法 ,这 种 方法 比较 简单 ,通过 
极 差 比较 即 可 得 到 较为 满意 的 结果 。 但 是 直观 分 析 法 不 能 估计 试验 过 程 中 以 及 试 
验 结果 测定 中 必然 存在 的 误差 大 小 , 即 它 无 法 区 分 某 个 因子 各 水 平 所 对 应 的 试验 
结果 之 间 的 差异 究竟 是 由 因子 水 平 不 同 引 起 的 ,还 是 由 试验 的 误差 所 引起 。 它 无 
法 确定 分 析 的 精度 。 为 了 解决 直观 分 析 法 的 这 个 缺陷 ,经 常 在 正 交 实验 设计 中 采 
用 方差 分 析 法 。 该 方法 是 通过 比较 各 因子 作用 所 产生 的 方差 与 纯 系 随机 因素 作 
的 方差 (随机 误差 ) 是 否 一 致 来 判断 因子 对 试验 结果 有 没有 显著 影响 ,于 是 可 将 因 
子 水 平 (或 交互 作用 ) 的 变化 所 引起 的 试验 结果 之 间 的 差异 与 试验 误差 所 引起 的 结 
果 波 动 区 分 开 来 。 如 果 因 子 水 平 的 变化 所 引起 的 试验 结果 的 变动 ,与 试验 误差 村 
差 不 大 ,说 明 这 个 因子 水 平 的 变化 没有 引起 试验 结果 的 足够 变动 ,影响 不 明显 ; 反 
之 ,如 果 因 子 水 平 的 变化 所 引起 的 试验 结果 的 变动 超过 试验 误差 的 范围 ,说 明 这 个 
因子 水 平 的 变化 影响 显著 。 

仍 以 上 面 的 正 交 试验 为 例 ( 见 表 16 - 12) 进 行 分 析 
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表 16-12 方差 分 析 正 交 实 验 























Pe oA hatd ye altehc dene gti EE Te 
因素 A-pH B 反 应 时 间 C 酵母 量 下 反应 液体 积 | 转化 率 
试验 号 /h /mg/mL) /mL /% 
1 1(8.0) 1(24) 3(500) 2(8) 79 
2 2(7.5) 1 1(300) 1(10) 68 
3 3(7.0) 1 | ”2(400) 3(6) 59 
4 1 2(18) 2 1 73 
5 2 2 3 3 68 
6 3 2 1 2 55 
7 1 3(12) 1 3 18 
8 2 3 2 2 47 
9 3 3 有 1 64 
K 一 水 平 1 之 和 170 206 141 205 总 和 一 531 
K: 一 水 平 2 之 和 183 196 179 181 
Ks 二 水 平 3 之 和 178 129 211 145 
分 别 计算 各 列 的 平方 和 ,得 到 


P=1/9X(531)’=31 329 
Qs=1/3X(170? 十 183? 十 178?) 二 31 357. 667 
Qs==1/3X(206: 十 196: 十 1292) 一 32 497. 667 
Qc=1/3X(1412 十 179: 十 2112) 一 32 147. 667 
QE=1/3X(205: 十 1812 十 1452) 一 31 937 
于 是 得 到 各 因子 的 平方 和 如 下 : 
SA 一 QA 一 P 一 28. 667 
Ss=Qs—P=1 168. 667 
Sc=Qc—P=818. 667 
Sr =Qr—P=608. 
总 平方 和 :。S= 2)x? 一 P= 33 953 一 31 329 一 2624 
误差 平方 和 : Se。 = S 一 SA 一 Ss 一 Sc 一 Sr 二 0.001 
由 于 上 述 的 方差 分 析 存 在 误差 平方 和 太 小 的 问题 ,而 且 误差 平方 和 的 自由 度 
为 0, 这样 使 检验 计算 显得 没有 必要 ,虽然 上 述 的 各 个 因子 都 是 选择 出 来 的 有 显著 
影响 的 因子 。 造 成 这 种 现象 的 原因 是 在 该 试验 的 正 交 表 设计 中 ,没有 安排 空白 误 
差 列 。 因 此 在 方差 分 析 时 , 正 交 表 的 设计 应 尽 可 能 选用 容量 大 一 些 的 表 , 安 排 一 些 
空白 列 , 供 误差 平方 和 计算 使 用 。 因 为 空白 列 不 安排 因子 , 故 其 偏差 平方 和 中 不 包 
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含 因子 水 平 的 变化 ,而 仅仅 反映 实验 误差 的 大 小 。 空 白 列 的 平方 和 计算 和 各 因子 
平方 和 相同 。 

解决 这 个 问题 的 另 一 方法 是 多 次 进行 重复 实验 ,也 可 以 将 某 个 平方 和 很 小 的 
因子 和 误差 平方 和 合并 ,以 提高 实验 误差 的 平方 和 及 其 自由 度 , 从 而 提高 假设 检验 
的 灵敏 度 。 如 果 无 法 安排 空白 列 , 也 可 以 根据 以 往 的 经 验 , 粗 略 估计 误差 的 方差 大 
小 , 供 下 检验 使 用 。 

在 上 述 例 子 中 ,将 A 因子 的 偏差 平方 和 与 误差 平方 和 合并 作为 新 的 误差 平方 
和 ,计算 得 到 





S: 一 SA 十 S. = 28.667 
计算 各 个 因子 的 下 值 和 总 的 F 值 并 进行 检验 ,从 而 得 到 试验 的 方差 分 析 表 ( 见 
表 16-13) ( 取 一 0.05)。 


表 16-13 方差 分 析 表 
方差 来 源 平方 和 自由 度 方差 F 显著 性 








1 168. 667 
878. 667 
608 

0. 001 
28. 668 


28. 667 | | 14.334 
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从 上 述 的 方差 分 析 表 可 知 ,各 个 因子 的 影响 顺序 为 : B 之 C > FE > A, 结果 和 
极 差 法 一 样 。 而 方差 分 析 还 能 定量 了 解 每 个 因子 对 结果 的 影响 程度 。 


第 四 节 ”回归 正 交 设 计 





回归 正 交 实验 设计 的 特点 和 正 交 实 验 设计 一 样 ,是 在 等 概率 的 条 件 下 , 比较 各 
个 变量 对 要 求 的 实验 值 的 影响 。 但 它 将 回归 分 析 和 正 交 实验 设计 有 机 地 结合 起 
来 ,进行 科学 的 实验 设计 、 合 理 的 实验 安排 和 方便 的 数据 处 理 。 它 是 用 回归 分 析 的 
方法 ,将 各 个 变量 的 变化 对 要 求 的 实验 值 的 误差 影响 进行 比较 ,并 加 以 检验 来 确定 
各 个 变量 的 作用 是 否 显著 。 根 据 变量 对 实验 结果 的 影响 ,可 以 分 为 线性 和 非 线性 
的 影响 关系 ,按照 回归 模型 自 变量 的 宕 次 数 ,回归 正 交 设计 可 以 分 为 一 次 回归 正 交 
设计 和 二 次 回归 正 交 设计 。 
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一 、 一 次 回归 正 交 设计 

1. 一 次 回归 正 交 设计 的 模型 

一 次 回归 正 交 设 计 可 以 处 理 模型 : 

?一 如 十 六 zi 十 br 十 … 十 bnzrm 
包括 可 以 转化 为 上 述 方程 的 模型 ,以 及 自 变量 之 间 存 在 交互 作用 的 模型 。 交 互 效 
应 反映 了 变量 之 间 的 互相 联系 。 例 如 含有 三 个 自 变 量 的 交互 作用 的 一 次 回归 正 交 
设计 模型 为 
y= bo 二 hz 二 bors 二 baz 二 byrizz bs rz 十 bzazs + brriz2rs 

式 中 :ziza，Zziza，za7z3 三 项 分 别 为 自 变量 zi ，zz，zs 之 间 的 交互 项 ，zi zazs 为 
自 变 量 xi，zs 和 xs 之 间 的 高 次 交互 项 。 在 一 般 情况 下 ,变量 的 高 次 交互 效应 项 可 
以 忽略 。 如 令 zizz，zizsy， zzzi，Zlz273 为 新 的 变量 ,该 模型 即 可 转化 为 标准 公 
式 , 转 变 为 典型 的 一 次 回归 正 交 设 计 模型 。 

由 此 类 推 ,可 以 得 到 一 次 回归 方程 所 处 理 的 数学 模型 通 式 为 


?一 名 十 Dbiz; 二 Ourirk 十 … 十 加 swzlize…Za 
Ac 




















We 
2. 一 次 回归 正 交 设计 的 实验 思想 
如 果 将 一 次 回归 的 数学 模型 改写 为 
yi =e = bbzitbrat tharm te (i=1,2,.,n) 


式 中 :y; 为 实验 值 , 按 正 交 设计 进行 了 次 实验 ,其 结果 为 y,，y,，…，y,。 于 是 得 
到 模型 的 结构 矩阵 : 











Es ct ~ st 
Be 
1 zx wy xm 
用 矩阵 形式 表示 ,方程 为 
Y 一 2J2 十 五 
式 中 ， Y=[y yy 





b= [b Bb (i 


i 


E={a 本 * eo] 


由 于 该 实验 是 按 正 交 表 要 求 所 设计 的 ,数据 具有 正 交 性 质 ,如 4X4 的 系数 矩阵 为 
| 4 0 0 





| 
1 1 -1 一 ! 0400 
X= ， 可 i XX= 
| -1 1 一 1 可 计算 得 到 00..4 "0 
1 -1 —1 1 0 0 4 
故 得 系数 和 矩阵: 
n 0 0 0 
0 Ph 0 0 n 0 0 0 
> 0 nm 0 0 
A=X'X=|0 0 > 三 0 |=|0 0 4 0 
41 一 2 
2 0 0 0 n 
0 0 0 Dz 
iel 
相关 矩阵 : 
l/ln 0 0 0 
0 1l/n 0 0 
C=A'=|0 0 1mm 0 
0 0 0 1/n 
常数 项 矩阵 ; 
2 
i=] 
Pt 1 11[y ~ Bo 
Driy 
Ty Xlz TD yz i=1 Bi 
B=X'Y= |r zz Ta | | | 一 | 这 = | B: 
: : : 2 zay 
“ : i=} 
ml Tm2 Tm Jn : 有 
Dry 
iml 
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模型 参数 b 的 最 小 二 乘 估 计 值 : 
b= (XX)'B 


bo ey Dy; 
n i=1 


b; = B,/n= 二 Driy: 
n il 
(i=1,2, ,nj=1,2,.,m) 


得 到 回归 方程 y= bo 十 bz 十 baxzi 十 … 十 bmzm。 

可 见 在 正 交 回归 设计 中 ,系数 矩阵 4 为 对 角 阵 ,于 是 系数 矩阵 4 和 其 道 矩 阵 C 
的 计算 大 大 简化 ,并 消除 了 回归 系数 的 相关 性 。 回 归 系数 的 方差 检验 也 大 大 简化 ， 
在 剔除 不 显著 变量 后 ,新 回归 系数 不 需要 重新 进行 估计 ,因为 对 于 多 元 线性 回归 ， 


其 新 老 系 数 之 间 的 关系 为 站 一 与 — Sab 关 让 ;而 cw 二 0 (关门 。 
显然 ,所 得 到 的 回归 系数 满足 最 小 二 乘法 要 求 : 


Q= ye 一 Fu) 
i=] iel 


Q= De = Dy bbzry— br —"— bnrm)’ = min 
1 i=1 














3. 一 次 回归 正 交 实验 的 设计 步 又 

回归 正 交 设计 首先 要 选择 合适 的 回归 正 交 表 ,一 次 回归 正 交 设计 只 需要 进行 
二 水 平 的 全 因子 实验 ,和 普通 的 正 交 表 类 似 , 若 有 p 个 因子 , 则 应 进行 2? 个 试验 。 
在 具体 的 选用 上 也 和 普通 的 正 交 表 一 样 。 这 种 正 交 表 和 其 对 应 的 普通 的 正 交 表 的 
唯一 区 别 是 ,以 [1] 和 [一 菇 代替 普通 正 交 表 中 的 [1] 和 [2], 以 表 中 的 数字 代 人 系数 
矩阵 ,该 矩阵 具有 正 交 性 ( 见 表 16 - 14) 。 











(1) L4C23) 表 16-14 回归 正 交 设计 表 
T 
中 
试验 号 列 号 | Zi | Zz 1T2 
1 1 1 | 1 
2 < 1 
3 
4 
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(2) Les(27) 








i te 入 a | a | es ha 
1 1 1 1 ] 1 1 1 1 
2 1 1 -1 | 1 —1 一 ! 一 1 
3 1 | -i 1 一 ! 1 一 1 一 1 
4 1 一 ! 一 1 | 一 1 一 ! 1 1 
5 一 ! 1 1 一 1 一 ! 1 一 ! 
6 一 ! 1 一 1 一 1 1 一 ! 1 
7 一 1 一 1 1 下 ~1 1 
8 一 ! 一 ! 一 1 1 1 1 一 1 























具体 的 正 交 表 选用 ,要 根据 因子 的 个 数 和 要 考察 的 交互 作用 因子 的 个 数 而 定 。 
为 了 简化 回归 分 析 的 计算 ,符合 正 交 表 中 的 特性 ,首先 须 将 影响 实验 结果 y 的 因素 
xz1， za，…， zwm 进行 转换 。 根 据 实验 过 程 要 求 确定 每 个 因子 z; 的 变化 范围 ,实验 结 
果 y 在 这 些 因子 的 变化 范围 内 呈 线 性 关系 。 实 验 水 平 可 以 取 每 个 因子 x; 变化 范 
围 的 两 个 端点 值 , 令 = 和 zz 分 别 表示 因子 *, 变化 范围 的 上 界 和 下 界 ,分别 定义 zv 
和 zs 为 因子 z; 的 下 水 平和 上 水 平 ,并 令 它们 的 算术 平均 值 ; 


24 十 zz 
zo = 


为 因子 z; 的 零 水 平 , 即 为 上 下 水 平 差 的 二 分 之 一 ;而 


Za2i Zl 
De 


为 因子 z, 的 变化 区 间 。 

对 各 个 因子 的 数值 进行 如 下 的 线性 变化 , 令 
Zi Zor 

a: 

由 于 与 数值 的 一 一 对 应 关系 ,分 别 用 变量 z; 代替 z;。 从 上 述 公式 可 知 , 当 = 在 区 
间 (zu， zs) 变 化 时 ,zi 的 变化 区 间 为 (一 1，1) ,符合 正 交 表 中 的 取 值 ,使 回归 系数 6 
不 受 z 的 单位 和 取 值 的 影响 ,而 直接 反映 了 因子 对 y 的 作用 大 小 。 

对 于 给 定 的 实验 条 件 和 获得 的 实验 结果 ,一 次 回归 正 交 设计 的 计算 表 如 
表 16 - 15 所 示 。 根 据 方差 分 析 表 模型 ,回归 系数 和 各 个 系数 的 偏 回 归 平 方 和 也 可 
以 很 方便 地 求 得 。 


Ti 二 


二 


表 16- 15 一 次 回归 正 交 设计 计算 表 
























试验 号 Zo EE ZI ve Tm > 
1 1 Tl Tim 沽 
2 1 Tal Ta Tam 多 
1 Tvi TN? bth Tm Ym 
Bi yy | my ry, Wg Drey, Dy 
bi=Bi/N Bo/N B/N B/N 0 B,/N 
Qi=bB, pe 





Q5 = Dy — B/N 
Q= Q5 — (Qi + +Q,) 
其 方差 分 析 参 见 表 16 - 16。 


表 16- 16 方差 分 析 表 








来 源 平方 和 自由 度 均 方 和 F 
国 1 Q Qi/s 
本 1 Q， Q/s: 
x | Qi=B:/N We Q, | Q,/s: 








Qr/(m* S:) 





剩余 | Q=Qy 一 Q& 











一 次 回归 正 交 设计 回归 方程 的 回归 过 程 中 ,除了 方程 的 总 体 下 检验 外 ,利用 求 
得 的 偏 回归 平方 和 ,可 以 很 容易 地 对 偏 回归 平方 和 进行 下 检验 。 因 子 的 方差 检验 
公式 为 











二 Q 
Fo ~ Q/(n—m—1) 


车 i 之 FF. a.wmv， 则 说 明 在 给 定 的 显著 性 水 平 下 ,该 因子 对 y 的 影响 是 显著 的 ; 
反之 ,应 该 剔除 该 影响 因子 。 

经 过 了 方差 检验 ,这 仅仅 是 考察 了 实验 变量 范围 内 的 两 个 端点 处 的 拟 合 情 况 。 
如 果 回归 方程 在 变量 范围 内 的 两 个 端点 处 实验 值 和 计算 值 符合 较 好 , 还 不 能 说 在 
整个 范围 内 实验 值 和 计算 值 符合 。 因 此 ,还 需要 在 变量 的 中 间 水 平 进行 若干 次 重 
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复 实验 ,这 称 为 零 水 平 的 重复 实验 检验 , 即 为 一 次 回归 正 交 设计 的 线性 检验 。 

在 零 水 平 上 进行 重复 实验 , 即 在 进行 n 次 重复 实验 后 ,得 到 其 实验 结果 的 平均 
值 , % 二 > ) yw/m。 由 回归 方程 得 到 ,在 各 因子 的 零 水 平 下 ,理论 上 yo 一 bo ,因此 可 
以 通过 检验 y。，bo (由 m 组 数据 求 得 ) 之 间 是 否 存在 显著 性 差异 ,作为 回归 方程 的 
线性 检验 。 如 作 检 验 , 记 Q& 二 2) (ys 一 允 ) ,其 自由 度 为 二 一 1, 则 要 求 满足 : 


1 _ Ih —yl* Vfot+fo_ Vfotho (pot fs) 














VQ+Q * Vl/ntl/m 


[ 例 16-4] 中 生 菌 素 高 产 菌株 U - 7 的 摇 瓶 培养 条 件 正 交 回归 试验 结果 分 
析 如 表 16 - 17 所 示 , 表 中 Zi 为 摇 床 转速 ,Z。 为 培养 基 装 量 ,Zs 为 培养 时 间 ,Z, 为 
培养 温度 ( 朱 昌 雄 . 中 国生 物 防 治 [J],1997,13(3),114 一 117) 。 


表 16- 17 试验 结果 分 析 








| | | | 

a 2 Am za | am| az | | a | fe 
试验 pg/mL) 

1 1 1(140) 1(60) 1 1(60) 1 1 1(27) 41.0 

2 1 1 1 1 = et —1 二 1(33) 37.0 

3 1 1 一 1(120) | 一 1 1 1 和 = 8.5 

4 L 1 | -3 上 1(84) | 一 1 1 1 25.0 

5 1 | 一 1(200) 1 = 1 = 1 1 51.0 

6 1 pk 1 rs ek 1 = 1 61.0 

7 1 bet | ei 1 1 = = 1 38.0 

8 1 一 | 1 me 1 之 二 35.0 

9 0(170) | 0(90) 1 0(72) 0(30) 17.5 

Bi 296.5| 一 73.0 83.5 5.5 | 1 二 33.5 

di 8 8 8 8 8 8 8 8 

bi 37.1| 一 9.1 10. 4 0.7 一 2.4| 一 0.7 0.9 4.2 

Qi 666. 1 871.5 3.8 47.5 3.8 7.0 140. 3 





























注 : 表 中 ( ) 内 数字 为 因子 所 取水 平 。 


从 表 中 可 见 最 佳 摇 瓶 培养 条 件 的 研究 结果 ,通过 各 因素 的 下 检验 ,4 因素 对 最 
终 产 素 量 的 影响 大 小 依次 为 
培养 基 装 量 之 播 床 转速 之 培养 温度 之 培养 时 间 
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它们 之 间 的 交互 关系 可 以 忽略 不 计 。 
通过 计算 ,得 出 其 回归 方程 式 为 


Y= 37.1 一 9.1Z, 十 10.42: 一 2.4Z: 十 4.2Z， 
方程 可 以 通过 零 水 平 检验 来 证 明 。 从 中 还 可 根据 极 差分 析 确定 其 最 佳 培养 条 

件 为 摇 床 转速 200 r/min, 装 量 为 60 ml/500 ml, 培 养 时 间 84 h, 培 养 温度 27°C 。 
二 、 二 次 回归 正 交 设 计 


1. 二 次 回归 正 交 设计 的 数学 模型 

当 变 量 y 与 自 变 量 x!，x:，…， zzn 之 间 的 函数 关系 在 所 研究 的 实验 范围 内 为 
非 线 性 函数 关系 时 ,该 关系 可 用 二 次 回归 方程 近似 地 描述 。 如 最 简单 的 含 二 个 自 
变量 的 二 次 回归 模型 可 写 为 


?一 名 十 名 十 名 buze + bez bizxixs 


式 中 :ziz 为 自 变量 zx ,xs 之 间 的 交互 项 ;前 几 项 为 rx 和 zi 的 线性 项 ,以 及 zz 
和 zs 的 平方 项 。 
由 此 类 推 , 可 以 得 到 二 次 回归 正 交 设计 所 处 理 的 数学 模型 通 式 为 


?> 一 名 十 ozi 十 baz? 十 Dbarizs 二 十 bizmT 1 TI" In 
4 1] ek 











(i=1, 2 m; k=1,2,.,m) 
如 忽略 高 阶 交互 项 , 则 模型 为 
y=b+ Dbizit Dbsr? + Dbarizs 
i 日 sk 


该 模型 共有 g 二 1 十 C 十 C 十 C2 二 C2 个 参数 ,而 根据 回归 过 程 原理 ,要 求 取 模 
型 参数 ,实验 次 数 应 至 少 大 于 gq。 

二 次 回归 正 交 实 验 设计 的 结构 和 矩阵 如 附录 中 的 设计 表 所 示 , 和 一 次 回归 正 交 
实验 设计 一 样 ,可 以 证 明 二 次 回归 设计 的 正 交 性 。 

2. 二 次 回归 正 交 设 计 的 步 叉 

二 次 回归 正 交 设计 的 步骤 和 一 次 回归 正 交 设 计 基 本 一 致 。 首 先 对 各 个 变量 进 
行 线性 变换 , 设 某 实 验 过 程 中 有 m 个 影响 因子 = ，z,，…，z。 ,其 中 第 i 个 因子 的 
上 界 、 下 界 分 别 为 zi，zza(i 一 1，2，…, m) , 即 分 别 定义 zi; 和 zz 为 因子 z; 的 下 水 
平和 上 水 平 。 

先 确 定 各 个 因子 的 零 水 平和 变化 区 间 : 
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Zi Zo; Zaz 
2 ， A 


2 


zo; 一 





对 各 个 因子 的 数值 进行 如 下 的 线性 变化 , 令 zx; = 区 一 各 , 则 原 变量 z 和 zz 的 编码 量 


Ai 

( 见 正 交 设 计 表 ) 具有 一 一 对 应 关系 。 

然后 根据 实验 要 求 , 选 取 二 次 回归 正 交 设计 表 , 编 制 实验 计划 。 根 据 二 次 回归 
正 交 设 计 计算 表 和 二 次 回归 方差 分 析 表 对 模型 参数 进行 计算 ,为 计算 二 次 回归 方 
程 的 系数 ,每 个 变量 所 取 的 水 平 应 大 于 等 于 3。 于 是 得 到 二 次 回归 正 交 设计 的 非 
线性 模型 。 

回归 正 交 设计 虽然 具有 实验 次 数 少 、 计 算 方 便 、 回 归 系 数 之 间 没有 相关 性 等 优 
点 ,但 是 它 也 有 设计 上 的 缺点 ,回归 正 交 设 计 所 得 到 的 条 件 一 般 不 是 实验 的 最 优 条 
件 , 只 是 较 好 的 条 件 。 因 为 二 次 回归 的 预测 值 的 方差 依赖 于 实验 点 在 因子 空间 的 
位 置 ,由 于 误差 的 干扰 ,实验 人 员 无 法 根据 预测 值 直接 寻找 最 佳 条 件 。 为 满足 设计 
的 最 优化 等 更 高 要 求 , 可 以 采用 回归 的 旋转 设计 .回归 的 D -最 优 设计 、 响 应 面 分 
析 等 。 

二 次 回归 设计 还 可 较 方便 地 利用 MATLAB、SAS、PSREG 等 软件 进行 处 理 。 

3, 二 次 回归 的 MATLAB 应 用 

对 于 二 次 回归 模型 : 

y= Dbizi+t Dbix?+ barizs 


上 式 右 端 从 前 到 后 ,分 别 为 常数 项 线性 项 ,平方 项 ,交互 项 。 
应 用 二 次 回归 交互 式 语句 : 


rstool(x,y) 





rstool(x,y,' model') 

rstool(x,y, model',alpha,' xname',' yname') 

式 中 x,y 为 列 向 量 , 含 95% 置 信 区 间 , 源 自 线性 

model 选项 ; 

' linear'; 表 示 模 型 含 常数 项 、 线 性 项 

"interaction'; 表 示 模 型 含 常数 项 、 线 性 项 、 交 叉 项 

'quadratic'; 在 interaction 的 基础 上 增加 平方 项 

' purequadratic': 表 示 模型 含 常数 项 、 线 性 项 .平方 项 

rstool 用 法 和 非 线 性 回归 nlintool 相似 ,在 rstool 画面 的 Export 区 的 参数 选 
项 中 可 得 到 各 种 计算 结果 :beta, rmse, residuals。 

[ 例 16-5] 红 铃 虫 的 产 卵 数 与 温度 有 关 。 现 得 到 数据 如 表 16 - 18 所 示 : 
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表 16 - 18 实验 数据 





温度 人民 21 23 25 27 29 32 35 
产 卵 数 7 11 21 | 24 66 115 325 
试 求 其 回归 函数 。 


x 一 [21 23 25 27 29 32 35]; y=[7 11 21 24 66 115 325]; rstool(x,y)。 
得 到 如 下 拟 合 图 ( 见 图 16 - 5)。 

















图 16-5 拟 合 图 


从 Export 区 可 得 到 拟 合 函数 的 系数 值 均 方差 和 残 差 。 在 linear 下 拉 式 列表 
框 中 可 选择 Quadratic 等 选项 。 

如 ;对 于 线性 拟 合 (Linear) : 

beta 一 一 463. 73 19. 87; 

rmse 一 62. 959 

因此 ,回归 方程 为 : 产 卵 数 一 463. 7311 十 19. 8704 * 温度 

如 :对 于 二 次 回归 (Full Quadratic) : 

beta 一 1482.1 一 123.06 2.553; 


rmse= 28. 227 
因此 ,得 到 的 二 次 回归 方程 为 : 产 卵 数 二 1482. 1 一 123. 06 * 温度 十 2. 553 x 
温度 2 


二 次 回归 相 比 线性 回归 ,可 以 显著 减 小 回归 的 标准 误差 ,从 原来 的 62. 959 减 


< 


少 到 28. 227, 相 应 的 拟 合 残 差 也 显著 减 小 , 故 该 拟 合 比 线性 拟 合 更 好 。 

[ 例 16-6] 设计 抗生素 PCA 的 发 酵 试 验 ,重点 考察 因子 为 葡萄 糖 底 物 和 种 
子 的 种 龄 。 参 照 中 心 组 合 实验 方案 ,各 自 变量 水 平 见 表 16 - 19, 实 验 设计 及 结果 见 
表 16 -20。 


表 16- 19 中 心 组 合 实验 变量 及 其 水 平 























因素 水 了 一 1.414 一 ! 0 1 1.414 
] 

Zz1 /葡萄 糖 % 0.78 0.8 0. 85 0.9 0.92 
/种 龄 bh 9.8 10 10.5 11 11.2 
表 16- 20 中 心 组 合 实验 设计 及 其 结果 
因 素 

试验 号 PCA/Cmg/L) 
让 I I 
1 =1 -1 1340 
当 一 1 1 1 278 
3 1 一 1 1 388 
4 1 1 1318 
5 0 0 1413 
6 0 0 1400 
7 0 0 1415 
8 0 0 1425 
9 0 0 1418 
10 1. 414 0 1 400 
11 一 1.414 0 1 313 
12 0 1. 414 1 323 
13 0 一 1.414 1 375 














使 用 rstool 函数 进行 拟 合 : 

X1=[—1 —111000001.414—1.41400]; 
X2=[—11—1100000001.414 一 1. 414]; 

X 一 [X1,X2]; 

Y=[1340 1278 1388 1318 1413 1400 1415 1425 1418 1400 1313 1323 1375]; 
rstool(X,Y) 
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回归 曲线 见 图 16 - 6。 











图 16-6 回归 曲线 图 


拟 合 的 二 次 回归 模型 为 
Y=1414. 2 十 26. 4X1 一 25. 7X2 一 34. 3Xi 一 38. 0X8 一 2X1X2 
rsme 一 16. 299 








对 模型 分 析 优化 , 求 得 稳定 点 XI 一 0. 395，X2 一 一 0. 358。 相 当 于 葡萄 糖 的 质量 
分 数 为 0. 87% ,种 龄 为 10. 3 h, 此 时 模型 预测 的 PCA 最 高 效 价 为 1 424 mg/IL。 

构造 PCA 发 酵 效 价 与 葡萄 糖 量 和 种 龄 的 三 维 空间 响应 曲面 图 ( 见 图 16 - 7)， 
可 以 明显 看 出 最 佳 葡萄 糖 浓度 在 0. 85% 一 0. 9% 之 间 , 最 佳 种 龄 在 10 一 10. 5 h 


之 间 。 















1 400 FE 
2 
iw ZE 
1200 KINI 
ee 
1 100: 


1 
种 龄 让 9.5 0.75 ee 葡萄 糖 /%6 
图 16-7 PCA 发 酵 效 价 与 葡萄 糖 量 和 种 龄 的 三 维 空间 响应 曲面 
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第 五 节 序 贯 实验 设计 


一 、 序 贯 实验 设计 


序 贯 实验 设计 是 一 个 边 实验 边 分 析 边 修正 的 设计 过 程 。 它 是 以 概率 论 、 数 理 
统计 和 信息 学 等 知识 为 基础 的 一 种 确定 实验 点 位 置 的 工作 方法 。 主 要 用 于 几 个 竞 
争 模型 的 鉴别 和 模型 参数 的 估计 。 

序 贯 实验 设计 与 通常 的 实验 方法 有 以 下 几 点 不 同 :@ 实 验 是 预先 设计 的 , 按 能 
获得 最 大 信息 量 的 原则 对 实验 进行 预先 设计 。@@ 实 验 序 贯 地 进行 。 它 不 像 传 统 的 
二 段 式 的 实验 方法 ,没有 实验 阶段 和 处 理 阶 段 之 间 的 信息 反馈 。 序 贯 实验 设计 是 
先 做 几 个 初步 实验 ,以 获得 初步 的 实验 信息 ,然后 在 此 基础 上 作出 决定 ,确定 后 续 
实验 的 条 件 , 依 此 类 推 反复 实验 ,直至 达到 预期 的 实验 目的 为 止 。 实 验 信息 在 整个 
实验 过 程 中 不 断 地 传递 和 反馈 ,使 后 续 实验 能 够 被 安排 在 局 部 最 优 的 条 件 下 进行 。 
如 果实 验 设计 合理 ,每 次 实验 均 能 获得 大 量 的 信息 ,就 可 以 大 大 减少 实验 的 工 
作 量 。 

序 贯 实验 设计 的 实验 是 为 了 逐步 排除 实验 的 不 肯定 性 ,逐步 增加 实验 的 信息 
量 。 实 验 过 程 的 不 肯定 性 下 降 , 则 肯定 性 增加 、 信 息 量 增加 。 但 是 不 同 过 程 需 了 解 
的 信息 量 不 一 样 ,不 同 的 实验 提供 的 实验 信息 也 是 不 一 样 的 。 以 非 线性 的 动力 学 
方程 为 例 , 如 果 一 个 方程 的 曲线 为 单调 增加 ,而 另 一 个 方程 的 曲线 为 增加 后 下 降 。 
显然 在 第 二 种 情况 下 ,实验 点 的 安排 要 比 第 一 种 情况 复杂 得 多 ,对 其 过 程 的 了 解 需 
要 更 多 的 信息 。 

上 述 例子 还 表明 不 同 的 实验 所 提供 的 实验 信息 人 
是 不 一 样 的 ,特别 是 实验 曲线 的 拐点 附近 ( 见 图 16 - 





8) ,其 实验 点 的 安排 对 了 解 曲线 的 变化 有 特别 意义 ， @ 

能 提供 较 多 的 信息 处 理 。 故 实验 点 的 选择 是 重要 的 。 @ 

如 果实 验 点 选择 得 不 好 ,在 某 一 个 区 域 即使 实验 点 安 

排 较 多 ,但 它们 对 整个 实验 过 程 的 贡献 可 能 还 不 如 在 

另 一 个 区 域 的 少数 几 个 实验 点 ,这 样 仍然 无 法 达到 预 0 = 
期 的 实验 目的 。 如 果实 验 点 选择 得 当 , 即 使 少量 的 实 。 图 16 - 8 实验 曲线 的 形状 
验 数 据 也 能 达到 预期 的 实验 目的 ,即使 精度 较 差 的 实 和 信息 量 的 关系 


验方 法 也 能 提供 所 需要 的 实验 信息 ,满足 实验 的 要 求 。 而 实验 设计 不 好 的 话 ,其 损 
失 单 靠 后 期 的 数据 处 理 手段 是 无 法 弥补 的 。 因 此 在 安排 实验 时 ,应 合理 确定 数据 
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的 数量 .数据 的 测量 精度 和 实验 点 的 分 布 。 

对 于 序 贯 实验 设计 的 模型 鉴别 是 采用 方差 分 析 或 某 个 给 定 的 目标 函数 对 各 个 
模型 的 可 靠 性 进行 后 验 性 比较 ,其 关键 是 最 佳 判别 式 的 选择 。 如 以 简单 的 两 个 线 
性 模型 为 例 : 





y=azr+t+b 
1 二 42 工 
在 这 两 个 模型 之 间作 出 判断 。 为 了 对 模型 进行 最 佳 判别 ,应 在 预期 差异 或 散 度 最 
大 的 地 方 设计 一 次 实验 ,而 不 是 在 两 模型 交叉 之 处 , 故 模型 的 判别 式 为 两 个 模型 的 
散 度 : 
D= [3 —3P7 

由 于 实验 存在 误差 ,如 果 判 别 式 能 够 结合 数据 测量 的 方差 ,就 更 为 有 效 。 

二 、 序 贯 实验 设计 的 参数 估计 


不 同 的 实验 所 提供 的 信息 量 是 不 一 样 的 。 实 验 的 信息 量 可 以 用 数学 参数 表 
示 , 假 定 某 一 个 实验 的 不 肯定 事件 $, 由 于 该 不 肯定 事件 是 一 个 随机 过 程 , 设 它 的 概 
率 分 布 为 p(&) ,信息 量 可 定义 为 
对 于 连续 函数 ， 
H(9 = 一 ELin pe] =—| ”pinp(9d 


对 于 离散 函数 ， 
五 (6) = 一 E[in p(8] =— Dp (eIn p(é) 


HH(&) 的 数值 可 用 于 衡量 事件 & 的 不 肯定 性 ,其 性 质 和 热力 学 中 的 炉 相似 ,因此 
称 为 甩 (&) 的 实验 炉 ,其 特性 则 和 概率 分 布 函 数 相似 。 实 验 过 程 是 不 肯定 性 下 降 过 
程 , 即 一 个 实验 炉 的 下 降 过 程 。 其 中 离散 型 信息 函数 在 生物 信息 数据 的 处 理 中 相 
当 重要 。 

在 生物 信息 理论 的 研究 中 , 某 一 事件 的 生物 信息 量 的 定义 同样 为 以 上 公式 ,只 
是 离散 数据 居多 。 生 物 信 息 量具 有 以 下 基本 性 质 :@ 连 续 非 负 性 , 五 这 0;@ 对 称 
性 ,各 个 信息 项 可 互 换 ;@ 扩 展 性 ,limplog Pp 王 0;@ 可 加 性 ,信息 可 累加 ;@ 极 值 性 ， 
H(pi, pa, **, p,)<logn。 

如 对 某 地 区 做 植物 资源 调查 , 测 得 采集 的 标本 分 布 概率 ,草本 、 灌 木 .乔木 在 低 
山 阔 叶 林 区 的 概率 为 /2, 1/3, 1/6。 可 计算 得 信息 量 : 


H 1/2log 1/2—1/3log 1/3—1/6log 1/6 = 1.011 4 








>ts 


而 人 草本、 灌木. 乔木 在 高 山 草 旬 区 的 概率 为 4/5、1/5、0。 可 计算 得 信息 量 : 
H=0.5004 


说 明 低 山 阔 叶 林 区 的 资源 丰富 ,信息 量 高 于 高 山 草 旬 区 。 
定义 实验 前 后 的 焙 差 


I= H(po) — H(B) 


此 即 为 实验 中 获得 的 信息 量 。 可 通过 实验 中 的 信息 量 的 变化 ,估计 各 个 实验 的 价 
值 ,判断 实验 设计 的 合理 性 。 因 此 , 序 贯 实验 设计 归根 到 底 是 对 实验 信息 量 的 优 
化 ,并 由 此 求 取 参 数 的 估计 值 。 

参数 估计 的 序 贯 实验 设 计 的 步骤 如 下 

(1) 在 已 知 的 实验 条 件 Xw 下 。 进 行 一 组 预 实验 ,根据 得 到 的 结果 Yw 初步 估 
计 参 数值 K'” ,以 此 作为 进一步 计算 的 初 值 。 预 实验 的 次 数 应 该 大 于 或 至 少 等 于 
模型 参数 的 个 数 。 

(2) 根据 以 上 计算 的 参数 Ke 值 , 用 最 优化 方法 在 实验 的 领域 内 求 取 max A 
时 的 Xi 点 。 

(3) 根据 求 得 的 实验 条 件 Xmw+1 ,进行 实验 , 求 取 相应 的 实验 结果 Ye 。 

(4) 对 实验 点 (Xuwt1，Ym+1) 重 新 估计 参数 , 求 得 Kut 。 

(5) 若 实验 误差 允许 ,在 给 定 置 信 度 水 平 c 下 , | Awrb 一 Av | 委 s, 则 实验 终止 ， 
否则 返回 步骤 (2) ,重新 进行 实验 设计 。 

数学 模型 参数 估计 的 序 贯 实验 设计 判别 式 为 





M+l 
sm =| 2 DIVi'D, 
各 
对 于 各 个 单 响应 的 .相互 独立 的 实验 , 且 具 有 等 同 的 实验 测定 的 误差 方差 ,该 式 可 
简化 为 
Mrl 
| Sprn, 
i=1 
4 也 是 待 设计 的 实验 点 的 函数 ， 
A= f(Xi, Ks, Xun) 





式 中 :DD 是 一 个 行 向 量 , D 一 [就 ， 就 ，…, 就 ]; "为 参数 个 数 ;V, 为 实验 误差 


的 协 方差 ,其 中 各 个 实验 误差 也 是 相互 独立 的 , 且 满 足 平均 值 为 0 的 正 态 分布 。 
序 贯 实验 设计 被 广泛 应 用 于 生命 科学 中 ,如 谭 载 友 等 (广东 药学 院 学 报 [J]， 
1995,11(1)) 将 序 贯 方法 用 于 药物 配方 的 优化 设计 。 药 物 配方 优化 设计 通常 包含 
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着 多 个 相关 的 因素 和 组 分 ,涉及 到 设计 变量 和 约束 条 件 , 既 要 考虑 药物 配伍 和 药 效 
发 挥 ,又 要 考虑 药物 毒性 副作用 、 成 本 价格 等 。 他 们 提出 了 一 个 基于 药物 作用 和 
价格 的 数学 模型 ,采用 计算 机 辅助 设计 ,利用 序 贯 方法 较 好 地 解决 了 问题 。 

徐 端正 等 (新 药 与 临床 [J],1994,13(1)) 成 功 地 将 序 贯 实验 设计 用 于 基因 工程 
干扰 素 a 治疗 肝炎 的 试验 ,取得 理想 效果 。 序 贯 实验 设计 因 边 试验 边 分 析 , 和 传统 
设计 固定 样本 法 相 比 ,可 以 节约 病例 数 30% 一 50%% ,而 且 干 扰 素 a 价格 昂贵 ,从 而 
可 大 大 降低 试验 成 本 。 

在 序 贯 实验 设计 的 参数 探索 过 程 中 ,如 果 目 标 函 数 对 某 一 参数 值 的 变化 不 敏 
感 , 则 该 参数 一 定 是 不 精确 的 ,应 该 对 该 参数 提出 疑问 。 一 般 来 说 ,目标 函数 对 某 
一 参数 的 梯度 越 大 ,该 参数 就 越 精确 。 实 验 过 程 的 设计 不 同 , 实 验 点 位 置 不 同 , 参 
数 的 搜索 过 程 就 不 同 , 实 验 结果 对 参数 的 精确 度 有 着 重要 影响 。 

在 实验 结果 整理 过 程 中 ,参数 估计 值 不 可 靠 或 不 精确 的 一 些 原因 和 修改 措 
施 有 : 

(1) 给 定 的 模型 不 正确 。 修 改 措施 首先 是 修正 模型 。 

(2) 测量 精度 差 。 需 提高 测量 精度 和 增加 测量 次 数 。 一 般 地 说 ,实验 精度 提 
高 10 倍 ,需要 重复 试验 100 次 。 因 此 ,设法 提高 实验 精度 是 首要 考虑 。 

(3) 实验 设计 不 合理 及 实验 点 位 置 影响 。 例 如 模型 回归 时 ,整体 的 残 差 平方 
和 很 小 , 即 总 体 拟 合 情 况 较 好 ,但 可 能 某 些 参数 的 方差 较 大 , 则 很 可 能 是 实验 设计 
不 合理 所 造成 的 结果 。 这 种 现象 在 同时 有 几 个 数学 模型 参与 竞争 时 表现 得 较为 明 
显 。 实 验 设计 不 合理 的 另 一 情况 是 没有 充分 考虑 实验 参数 之 间 相 互 作用 的 影响 ， 
在 设计 时 应 尽量 选择 独立 变量 ,减少 参数 之 间 的 交互 作用 和 相关 性 。 

以 上 的 修改 措施 同样 适合 于 其 他 的 试验 设计 。 





本 章 学 习 要 点 : 

(1) 了 解 实验 设计 的 价值 。 

(2) 了 解 正 交 设计 、 正 交 表 及 其 计算 方法 。 
(3) 了 解 回归 正 交 设计 及 其 计算 方法 。 
(4) 运用 MATLAB 计算 回归 正 交 设计 。 
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附录 1 标准 正 态 分 布 表 


gz) 

















0.0013|0.0010 ee ee 0. 000 210. 000 210. 000 110. 000 1|0.0000 

0. 001 9|0. 001 8|0. 001 7|0. 001 7|0. 001 6|0. 001 6|0. 001 5|0. 001 5|0.0014|0.0014 

0. 002 6| 0. 002 5|0. 002 4| 0. 002 3|0. 002 3|0. 002 2|0. 002 1|0. 002 1|0.0020|0.0019 

0. 003 5| 0. 003 4| 0. 003 3| 0. 003 2|0. 003 1|0. 003 0| 0. 002 9|0. 002 8| 0. 002 7|0. 0026 

0. 004 7|0. 004 5|0. 004 4| 0. 004 3|0. 004 1|0. 004 0|0. 003 910. 003 8|0. 003 7|0. 0036 

0. 006 2|0. 006 0| 0. 005 9| 0. 005 7|0. 005 5|0. 005 4| 0. 005 2|0. 005 1|0. 004 9|0.0048 

一 2.4|0.008 2|0. 0080|0.007 8|0. 007 5|0. 007 3|0. 007 1|0. 006 9|0.006 8|0. 006 6|0. 006 4 
一 2.3|0.0107|0.010 4|0.010 2|0.009 9|0.009 6|0.009 4|0.009 1|0.0089|0.0087|0.0084 
一 2.2|0.013 9|0.013 6|0.013 2|0.012 9|0.012 6|0.012 2|0.0119|0.0116|0.0113|0.0110 
一 2. 1|0.017 9|0.017 4|0.017 0|0. 016 6| 0.016 2|0.015 8|0.015 4|0.015 0|0.0146|0.0143 
一 2.0|0.022 8|0. 022 2|0. 021 7|0. 021 2| 0. 020 7|0. 020 2|0. 019 7|0. 019 2|0.018 8|0.018 3 
一 1.9|0.0287|0.028 1|0. 0274|0.026 8|0. 026 2|10. 025 6|0. 025 0|0. 024 4|0. 023 8|0.023 3 
一 1.8|0.035 9|0. 035 2|0. 0344|0. 033 6|0. 032 9|0. 032 2|0.0314|0.0307|0.0300|0.0294 
一 1.7|0.044 6|0.043 6|0. 0427|0. 041 8|0. 040 9|0. 040 1|0.039 2|0.0384|0.0375|0.0367 
一 1.6|0.054 8|0.053 7|0.052 6|0.051 6|0. 050 5|0. 049 5|0. 048 5|0.047 5|0.046 5|0.0455 
一 1.5|0.066 8|0. 065 5|0.064 3|0.063 0|0.061 8|0. 060 6|0.0594|0.0582|0.0570|0.0559 
一 1.4|0.0808|0.079 3|0.077 8|0.076 4|0.074 9|0.073 5|0.072 2|0.070 8|0.0694|0.068 1 
一 1.3|0.096 8|0.095 1|0.093 4|0. 091 8|0.090 1|0.088 5|0.086 9|0. 085 3|0.083 8|0.082 3 
一 1.2|0.1151|0.113 1|0. 111 2|0. 109 3| 0. 107 5|0. 105 6| 0. 103 8| 0. 102 0| 0. 100 3| 0. 098 5 
一 1.1|0.1357|0. 133 5|0. 1314|0. 129 2|0. 127 1|0. 125 1| 0. 123 0|0. 121 0|0. 119 0|0. 117 0 
一 1.0|0.1587|0. 156 2|0. 153 9|0. 151 5|0. 149 2| 0. 146 9| 0. 144 6| 0. 142 3| 0. 140 1|0. 137 9 
一 0.9|10. 184 1|0. 181 4|0. 178 8| 0. 176 2|0. 173 6| 0. 171 1| 0. 168 5|0. 166 0| 0. 163 5|0. 161 1 
—0. 8|0. 211 9|0. 209 0|0. 206 1|0. 203 3|0. 200 5|0. 197 7|0. 194 9|0. 192 2|0. 189 4|0. 186 7 
一 0.7|0. 242 0|0. 238 9|0. 235 8| 0. 232 7| 0. 229 7|0. 226 6 | 0. 223 6| 0. 220 6| 0. 217 7|0. 214 8 
一 0.6|0.2743|0.2709|10.2676|0.264 3|0.2611|0. 257 8|0. 254 6|0. 251 4|0. 248 3| 0. 245 1 
一 0.5|0. 308 5|0. 305 0|0. 301 5|0. 298 1|0. 294 6|0. 291 2|0. 287 7|0. 284 3|0. 281 0|0. 2776 
一 0.4|0.344 6|0. 340 9|0. 337 2|0. 333 6|0. 330 0|0. 326 4| 0. 322 8|0. 319 2|0. 315 6| 0. 312 1 
一 0.3|0. 382 1|0. 378 3|0. 374 5|0. 370 7| 0. 366 910. 363 2|0. 359 4| 0. 355 7|0. 352 010. 348 3 
一 0.2|0.4207|0.416 8|0.4129|0.409 0|0.405 2|0.4013|0.3974|0. 393 6|0.3897|0.3859 
一 0. 1|0.460 2|0.456 2|0. 452 2|0. 448 3|0. 444 3|0. 440 4|0. 436 4| 0. 432 5|0. 428 6|0. 424 7 
0.0|0. 500 0|0. 496 0|0. 492 0| 0. 488 0|0. 484 0| 0. 480 1|0. 476 1|0. 472 1|0. 468 1|0. 464 1 
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( 续 表 ) 























一 一 一 一 一 一 一 一 
z 0 1 2 3 4 5 6 7 8 9 
0.0 |0.550 0|0. 504 0|0. 508 0|0. 5120|0. 516 0|0. 519 9|0. 523 9|0. 527 9|0. 531 910. 535 9 
0.1 |0.539 8|0. 543 8|0. 547 8|0. 551 7|0. 555 7| 0. 559 6| 0. 563 6|0. 567 5| 0. 571 4|0. 575 3 
0.2 |0.579 3|0. 583 2|0. 587 1|0. 591 0|0. 594 8|0. 598 7|0. 602 6|0. 606 4|0. 610 3|0.614 1 
0.3 |0.617 9|0. 6217|0. 622 5|0. 629 3|0. 633 1|0. 636 8|0. 640 6|0. 644 3|0. 648 0|10. 6517 
0.4 |0.655 4|0.659 1|0.6628|0. 666 4|0.6700|0. 673 6|0.677 2|0. 680 8|0.684 4|0.6879 
0.5 |0.6915|0.695 0|0. 698 5|0. 701 9|0. 705 4|0.7088|0.7123|0.7157|0.7190|0.7224 
0.6 |0.725 7|0.729 1|0.7324|0.7357|0.738 9|0.742 2|0.7454|0.7486|0.7517|0.7549 
0.7 |0.7580|0.761 1|0.7642|0.767 3|0.770 3|0.773 4|0.776 4|0.7794|0.7823|0.785 2 
0.8 |0.788 1|0.7910|0.793 9|0.7967|0.799 5|0.8023|0.805 1|0.8078|0.8106|0.813 3 
0.9 |0.815 9|0.818 6|0.821 2|0. 823 8|0.836 4|0.828 9|0.8315|0.8340|0.836 5|0.8389 
1.0 |0.841 3|0. 843 8|0. 846 1|0. 848 5|0. 850 8| 0. 853 1| 0. 855 4|0. 857 7| 0. 859 9|0. 862 1 
1.1 |0.864 3|0.866 5|0.868 6|0.8708|0.8729|0.8749|0.8770|0.8790|0.8810|0.8830 
1.2 |0.884 9|0.886 9|0. 888 8|0. 890 7|0. 892 5|0. 894 4|0. 896 2|0. 898 0|0. 8997|0.9015 
1.3 |0.903 2|0.904 9|0. 906 6|0. 908 2|0. 909 9|0.911 5|0.913 1|0.914 7|0.916 2|0.9177 
1.4 |0.919 2|0,.9207|0.922 2|0.923 6|0. 925 1|0.926 5|0.9278|0.929 2|0.9306|0.9319 
1.5 |0.933 2|0.934 5|0.935 7|0.937 0|0. 938 2| 0. 939 4| 0. 940 6| 0. 941 8|0. 943 0|0. 944 1 
1.6 |0.945 2|0.946 3|0. 9474|0. 948 4| 0. 949 5|0. 950 5|0. 951 5|0. 952 5|0. 953 5|0.954 5 
1.7 |0.955 4|0.956 4|0.957 3|0. 958 2|0. 959 1| 0. 959 9|0. 960 8|0. 961 6|0. 962 5|0. 963 3 
1.8 |0.964 1|0.9648|0.965 6|0.966 4|0.967 1|0.9678|0.968 6|0.969 3|0.9700|0.9706 
1.9 |0.971 3|0.9719|0.972 6|0.973 2|0.9738|0.744 |0.9750|0.975 6|0.976 2|0.9767 
2.0 |0.977 2|0.977 8|0.978 3|0.978 8| 0. 979 3|0. 979 8| 0. 980 3| 0. 980 8| 0. 981 2|0.9817 
2.1 |0.986 1|0.9864|0.986 8|0.987 1| 0.987 4| 0. 987 8|0. 988 1|0. 988 4|0.9887|0.9890 
2.2 |0.986 1|0.986 4|0.986 8|0.987 1|0.987 4| 0. 987 8|0. 988 1|0. 988 4|0.988 7|0.9890 
2.3 |0.989 3|0. 989 6|0.989 8|0. 990 1|0. 990 4| 0. 990 6|0. 990 9|0. 991 1|0.991 3|0. 9916 
2.4 |0.9918|0. 9920|0. 992 2|0. 992 5|0. 992 7|0. 992 9|0. 993 1|0. 993 210. 993 4|0. 993 6 
2.5 |0.9938|0.9940|0.9941|0.994 3|0.9945|0.994 6|0.9948|0.9949|0.9951|0.9952 
2.6 |0.995 3|0.995 5|0. 995 6| 0. 995 7|0. 995 9|0. 996 0|0. 996 1| 0. 996 2| 0. 996 3| 0. 996 4 
2.7 |0.996 5|0. 996 6|0.9967|0.996 8|0.996 9|0. 997 0|0.997 1|0. 997 2|0.997 3|0.9974 
2.8 |0.9974|0.997 5|0.997 6|0.9977|0.9977|0.997 8|0.997 9|0.9979|0.9980|0.9981 
2.9 |0.9981|0.9982|0.9982|0.998 3|0. 998 4|0.9984|0.9985|0.9985|0.9986|0.9986 
3.0 |0.9987|0.9990|0.999 3|0.999 5|0.9997|0.999 8|0.9998|0.9999|0.9999|1.0000 
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附录 2 上 分 布 表 
a 
P{i(m) >t(m}=a O tn) 
n a 一 0.25 0. 10 0. 05 0. 025 0.01 0. 005 
1 1.0000 3.0777 6.3138 12.7062 31.8207 63. 657 4 
2 0.8165 1.8856 2.9200 4.3027 6.9646 9.9248 
3 0.7649 1.6377 2.3534 3.1824 4.5407 5.8409 
4 0.7407 1.533 2 2.1318 2.776 4 3.7469 4.6041 
5 0.7267 1.4759 2.0150 2.5706 3.3649 4.0322 
6 0.7176 1.439 8 1.943 2 2. 446 9 3.142 7 3.707 4 
7 0.7111 1.4149 1.8946 2.3646 2.9980 3.4995 
8 0.706 4 1.3968 1.8595 2.3060 2.8965 3.3554 
9 0.7027 1.3830 1.833 1 2. 262 2 2.8214 3.2498 
10 0.6998 1.3722 1.8125 2.2281 2.7638 3.1693 
11 0.6974 1.3634 1.7959 2.2010 2.7181 3.1058 
12 0.6955 1.356 2 1.782 3 2.1788 2.6810 3.0545 
13 0.693 8 1.3502 1.7709 2.1604 2.6505 3,0123 
14 0. 692 4 1.3450 1.761 3 2.1448 2.6245 2.9768 
15 0.691 2 1.3406 1.7531 2.1315 2.6025 2.9467 
16 0. 690 1 1.3368 1.7459 2.1199 2.5835 2.9208 
17 0.6892 1.3334 1.7396 2.1098 2.5669 2. 898 2 
18 0.6884 1.3304 1.7341 2.1009 2.5524 2.8784 
19 0.6876 1.3277 1.7291 2.0930 2.5395 2. 8609 
20 0.6870 1.3253 1.7247 2.0860 2.5280 2.8453 
21 0.686 4 1.3232 1.7207 2.0796 2.5177 2.831 4 
22 0.6858 1.3212 1.7171 2.0739 2.5083 2.8188 
23 0.6853 1.3195 1.7139 2.0687 2.4999 2.8073 
24 0.6848 1.3178 1.7109 2.0639 2.4922 2.7969 
25 0.6844 1.316 3 1.708 1 2.0595 2. 485 1 2.7874 
26 0.6840 1.3150 1.7056 2.0555 2.4786 2.7787 
27 0.6837 1.3137 1.7033 2.0518 2.4727 2.7707 
28 0.6834 1.3125 1.7011 2.048 4 2.467 1 2.7633 
29 0.6830 1.3114 1.6973 2.0423 2.4620 2.7500 
30 0.6828 1.3104 1.6973 2.0423 2.457 3 2.7500 
31 0.6825 1.3095 1.6955 2.0395 2.4528 2.7440 
32 0.682 2 1.3086 1.6939 2.0369 2.4487 2.7385 
33 0.6820 1.3077 1.6924 2.0345 2.4448 2.7333 
34 0.6818 1.3070 1.6909 2.0322 2.441 1 2.7284 
35 0.6816 1.3062 1.6896 2.0301 2.4377 2.7238 
36 0.6814 1.3055 1.6883 2.0281 2.4345 2.7195 
37 0.6812 1.3049 1.6871 2.0262 2.4314 2.7154 
38 0.6810 1.3042 1.6860 2.0244 2.4286 2.7006 
39 0.6808 1.3036 1.6849 2.0227 2.4258 2.7079 
40 0.6807 1.3031 1.6839 2.0211 2.4233 2.7045 
41 0. 6805 1.3025 1.6829 2.0195 2.4208 2.7012 
42 0. 680 4 1.3002 1.6820 2.0181 2.4185 2.6981 
43 0.6802 1.3016 1.6811 2.0167 2.4163 2.6951 
44 0.6801 1.3011 1.6802 2.0154 2.4141 2.6923 
45 0.6800 1.3006 1.6794 2.0141 2.4121 2.6896 
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附录 3 X 分 布 表 











PIX (mW 之 失 (0D) 一 0 XE() 

n 0.99 0.975 0. 95 0.75 
和 PE ey 0.001 0.004 102 
2 0.010 0.020 0.051 0. 103 575 
3 0.072 0.115 0.216 0.352 213 
4 0. 207 0. 297 0.484 0.711 923 
5 0.412 0.554 0.831 1.145 675 
6 0.676 0. 872 1.297 1.635 455 
学 0. 989 1. 239 1.690 2.167 255 
8 1.344 1.646 2.180 2.793 071 
9 1.735 2.088 2. 700 3. 325 899 
10 2. 156 2. 558 3. 247 3. 940 737 
11 2. 603 3. 053 3.816 4.575 584 
12 3.074 3.571 4. 404 5. 226 438 
13 3. 565 4. 107 5. 009 5. 892 299 
14 4.075 4. 660 5.629 6.571 165 
15 4. 601 5. 229 6. 262 7. 261 037 
16 5. 142 5.812 6. 908 7.962 912 
17 5.697 6. 408 7.564 8. 627 792 
18 6. 265 7.015 8. 231 9. 390 675 
19 6.844 7.633 8. 907 10. 117 562 
20 7. 434 8. 260 9. 591 10. 851 452 
21 8.034 8. 897 10. 283 11. 591 344 
22 8. 643 9. 542 10. 982 12. 338 240 
23 9. 260 10. 196 11. 689 13.09] 137 
24 9. 886 10. 856 12. 401 13. 848 037 
25 10. 520 11. 524 13. 120 14. 611 939 
26 11. 160 12. 198 13. 844 15. 379 843 
27 11. 808 12. 879 14. 573 16. 151 749 
28 12. 461 13. 565 15. 308 16. 928 657 
29 13.121 14.257 16.047 17. 708 567 
30 13.787 14. 954 16. 791 18. 493 478 
31 14. 458 15. 655 17. 539 19. 281 390 
32 15. 134 16. 362 18. 291 20. 072 304 
33 15. 815 17. 074 19. 047 20. 867 219 
34 16. 501 17. 789 19. 806 21. 664 136 
35 17. 192 18. 509 20. 569 22. 465 054 
36 17. 887 19. 233 21. 336 23. 269 973 
37 18. 586 19. 960 22. 106 24.075 893 
38 19. 289 20. 691 22. 878 24. 884 815 
39 19. 996 21. 426 23. 654 25. 695 737 
40 20. 707 22. 164 24. 433 26. 509 660 
41 21. 421 22. 906 25.215 27. 326 585 
42 22. 138 23. 650 25. 999 28. 144 510 
43 22. 859 24. 398 26. 785 28. 965 436 
44 23. 584 25. 148 27. 575 29.787 363 
45 24.311 25. 901 28. 366 30.612 291 
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( 续 表 ) 








n a= 0.25 0.10 0.05 0.025 0.01 0.005 
1 1. 323 2.706 3. 841 5. 024 6. 635 7.879 
2 2.773 4. 605 5. 991 7.378 9.210 10. 597 
3 4.108 6.251 7.815 9. 348 11. 345 12. 838 
4 5. 385 7.779 9. 488 11.143 13.277 14. 860 
5 6. 625 9. 236 11.071 12. 833 15. 086 16.750 
6 7. 841 10. 645 12. 592 14. 449 16. 812 18. 548 
学 9. 037 12.017 14. 067 16.013 18. 475 20. 278 
8 10. 219 13. 362 15. 507 17. 535 20. 090 21. 955 
9 11. 389 14. 684 16. 919 19. 023 21. 666 23. 589 
10 12.549 15. 987 18. 307 20. 483 23. 209 25. 188 
11 13. 701 17. 275 19. 675 21.920 24. 725 26. 757 
12 14. 845 18. 549 21. 026 23. 337 26.217 28. 299 
13 15. 984 19. 812 22. 362 24.736 27. 688 29. 819 
14 17:5:117 21.064 23. 685 26. 119 29. 141 31.319 
15 18. 245 22. 307 24. 996 27. 488 30.578 32. 801 
16 19. 369 23. 542 26. 296 28. 845 32. 000 34. 267 
17 20. 489 24. 769 27. 587 30. 191 33. 409 35. 718 
18 21. 605 25. 989 28. 869 31. 526 34. 805 37.156 
19 22.718 27. 204 30. 144 32. 852 36. 191 38. 582 
20 23. 828 28. 412 31.410 34.170 37. 566 39. 997 
21 24. 935 29. 615 32. 671 35. 479 38. 932 41. 401 
22 26. 039 30. 813 33. 924 36. 781 40. 289 42. 796 
23 27. 141 32. 007 36. 415 39. 364 42. 980 45. 559 
24 28. 241 33. 196 36. 415 39. 364 42. 980 45. 559 
25 29. 339 34. 382 37. 652 40. 646 44. 314 46. 928 
26 30. 435 35. 563 38. 885 41.923 45. 642 48. 290 
27 31. 528 36. 741 40. 113 43. 194 46. 963 49. 645 
28 32. 620 37. 916 41. 337 44. 461 48. 278 50. 993 
29 33.711 39.087 42. 557 45. 722 49. 588 52. 336 
30 34. 800 40. 256 43.773 46. 979 50. 892 53. 672 
31 35. 887 41. 422 44. 985 48. 323 52. 191 55. 003 
32 36. 973 42. 585 46. 194 49. 480 53. 486 56. 328 
33 38. 058 43.745 47. 400 50.725 54.776 57. 648 
34 39. 141 44. 903 48. 602 51. 966 65. 061 58. 964 
35 40. 223 46. 059 49. 802 53. 203 57. 342 60. 275 
36 41. 304 47. 212 50. 998 54. 437 58. 619 61. 581 
37 42. 383 48. 363 52. 192 55. 668 59. 892 62. 883 
38 43. 462 49.513 53. 384 56. 896 61. 162 64. 181 
39 44. 539 50. 660 54. 572 58. 120 62. 428 65.476 
40 45. 616 51. 805 55. 758 59. 342 63. 691 66. 766 
41 46. 692 52. 949 56. 942 60. 561 64. 950 68. 053 
42 47. 766 54. 090 58. 124 61.777 66. 206 69. 336 
43 48. 840 55. 230 59. 304 62. 990 67.459 70. 616 
44 49. 913 56. 369 60. 481 64. 201 68. 710 71. 893 
45 50. 985 57. 505 61. 656 65. 410 69. 957 73. 166 
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附录 4 下 分 布 表 


P{Flm, n) > Fn,n)}=a 





0 Fm, my) 
a=0.10 
1 2 3 4 5 
nz 
1 | 39.86 | 49.50 | 53.59 | 55.83 | 57.24 | 58.20 | 58.91 | 59.44 
2 8. 53 9. 00 9.16 8.24 9.29 9.33 9. 35 9.37 
3 5. 54 5. 46 5. 39 5.34 5.31 5.28 5.27 5.25 
4 4.54 4.32 4. 19 4.11 4.05 4.01 3.98 3.95 
5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 
6 3.78 3.46 3. 29 3. 18 3.11 3.05 3.01 2.98 
? 3.59 3.26 3.07 2.96 2. 88 2.83 2.78 2.75 
8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 
9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 
10 3.29 2.92 2.73 2. 61 2.52 2.46 2.41 2.38 
11 3.23 2.86 2. 66 2.54 2.45 2.39 2.34 2.30 
12 3.18 2. 81 2. 61 2.48 2.39 2.33 2.28 2.24 
13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 
14 3.10 7 2.52 2.39 31 2.24 2.19 2.15 
15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 
16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 
17 3.03 2.64 2.44 2.31 2. 22 2.15 2.10 2.06 
18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 
19 2. 99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 
20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 
21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 
22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 
23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 
24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 
25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 
26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 
27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 
28 2. 89 2.50 2.29 2.16 2.06 2. 00 1.94 1.90 
29 2.89 2.50 2.28 各 首 2.06 1.99 1.93 1.89 
30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 
40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 
60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 
120 2.75 2.35 让 1.99 1.90 1.82 1.77 1.72 
oo 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 



































9 10 12 15 20 24 30 40 60 i20 oo 
59.58 |60.19 |60.71 |61.22 |61.74 | 62.00 |62.26 |62.53 |62.73 |63.00 | 63.33 
9.38 | 9.39 | 9.41 | 9.42 | 9.44 | 9.45 | 9.46 | 9.47 | 9.47 | 9.48 | 9.49 
5.24 | 5.23 | 5.22 | 5.20 | 5.18 | 5.18 | 5.17 | 5.16 | 5.15 | 5.14 | 5.13 
3.94 | 3.92 | 3.90 | 3.87 | 3.84 | 3.83 | 3.82 | 3.80 | 3.79 | 3.78 | 3.76 
3.32 | 3.30 | 3.27 | 3.24 | 3.21 | 3.19 | 3.17 | 3.16 | 3.14 | 3.12 | 3.10 
2.96 | 2.94 | 2.90 | 2.87 | 2.84 | 2.82 | 2.80 | 2.78 | 2.76 | 2.74 | 2.72 
2.72 | 2.70 | 2.67 | 2.63 | 2.59 | 2.58 | 2.56 | 2.54 | 2.51 | 2.49 | 2.47 
2.56 | 2.54 | 2.50 | 2.46 | 2.42 | 2.40 | 2.38 | 2.36 | 2.34 | 2.32 | 2.29 
2.44 | 2.42 | 2.38 | 2.34 | 2.30 | 2.28 | 2.26 | 2.23 | 2.21 | 2.18 | 2.16 
2.35 | 2.32 | 2.28 | 2.24 | 2.20 | 2.18 | 2.16 | 2.13 | 2.11 | 2.08 | 2.06 
2.27 | 2.25 | 2.21 | 2.17 | 2.12 | 2.10 | 2.08 | 2.05 | 2.03 | 2.00 | 1.97 
2.21 | 2.19 | 2.15 | 2.10 | 2.06 | 2.04 | 2.01 | 1.99 | 1.96 | 1.93 1. 90 
2.16 | 2.14 | 2.10 | 2.05 | 2.01 | 1.98 | 1.96 | 1.93 | 1.90 | 1.88 | 1.85 
2.12 | 2.10 | 2.05 | 2.01 | 1.96 | 1.94 | 1.91 | 1.89 | 1.86 | 1.80 | 1.80 
2.09 | 2.06 | 2.02 | 1.97 | 1.92 | 1.90 | 1.87 | 1.85 | 1.85 | 1.79 1.76 
2.06 | 2.03 | 1.99 | 1.94 | 1.89 | 1.87 | 1.84 | 1.81 L701 .75 | 吉政 
2.03 | 2.00 | 1.96 | 1.91 1.86 | 1.84 | 1.81 | 1.78 | 1.75 | 1.72 | 1.69 
2.00 | 1.98 | 1.93 | 1.89 | 1.84 | 1.81 1.78 | 1.75 | 1.72 | 1.69 | 1.66 
1.98 | 1.96 | 1.91 1.86 | 1.81 1.78 | 1.76 | 1.73 | 1.70 | 1.67 1.63 
1.96 | 1.94 | 1.89 | 1.84 | 1.79 | 1.77 | 1.74 | 1.71 1.68 | 1.64 1.61 
1.95 | 1.92 | 1.87 | 1.83 | 1.78 | 1.75 | 1.72 | 1.69 | 1.66 | 1.62 | 1.59 
1.93 | 1.90 | 1.86 | 1.81 | 1.76 | 1.73 | 1.70 | 1.67 | 1.64 | 1.60 | 1.57 
1.92 | 1.89 | 1.84 | 1.80 | 1.74 | 1.72 | 1.69 | 1.66 | 1.62 | 1.59 | 1.55 
1.91 | 1.88 | 1.83 | 1.78 | 1.73 | 1.70 | 1.67 | 1.64 | 1.61 | 1.57 | 1.53 
1.90 | 1.87 | 1.82 | 1.77 | 1.72 | 1.69 | 1.66 | 1.63 | 1.59 | 1.56 | 1.52 
1.89 | 1.86 | 1.81 | 1.76 | 1.71 | 1.68 | 1.65 | 1.61 1.58 | 1.54 | 1.50 
1.88 | 1.85 | 1.80 | 1.75 | 1.70 | 1.67 | 1.64 | 1.60 | 1.57 | 1.53 | 1.49 
1.87 | 1.84 | 1.79 | 1.74 | 1.69 | 1.66 | 1.63 | 1.59 | 1.56 | 1.52 | 1.48 
1.86 | 1.83 | 1.78 | 1.73 | 1.68 | 1.65 | 1.62 | 1.58 | 1.55 | 1.51 1.47 
1.85 | 1.82 | 1.77 | 1.72 | 1.67 | 1.64 | 1.16 | 1.57 | 1.54 | 1.50 | 1.46 
1.79 | 1.76 | 1.71 | 1.66 | 1.61 | 1.57 | 1.54 | 1.51 1.47 | 1.42 | 1.38 
1.74 | 1.71 1.66 | 1.60 | 1.54 | 1.51 | 1.48 | 1.44 | 1.40 | 1.35 1.29 
1.68 | 1.65 | 1.60 | 1.55 | 1.48 | 1.45 | 1.41 | 1.37 | 1.32 | 1.26 | 1.19 
1.63 | 1.60 | 1.55 | 1.49 | 1.42 | 1.38 | 1.34 | 1.30 | 1.24 | 1.17 | 1.00 


-00= 












































a 1 2 3 4 5 6 8 
me 
1 | 161.4 | 199.5 | 215.7 | 224.6 | 230.2 | 234.0 | 236.8 | 238.9 
2 | 18.51 | 19.00 | 19.16 | 19.25 | 19.30 | 19.33 | 19.35 | 19.37 
3 | 10.13 | 9.55 | 9.28 | 9.12 | 9.01 | 8.94 | 8.89 | 8.85 
4 | 7.71 | 6.94 | 659 | 6.39 | 6.26 | 6.16 | 6.09 | 6.04 
5 | 661 | 579 | 5.41 | 519 | 505 | 495 | 488 | 4.82 
6 | 599 | 514 | 476 | 453 | 439 | 4.28 | 4.21 | 4.15 
7 | 559 | 474 | 435 | 412 | 3.97 | 3.87 | 3.79 | 3.73 
8 | 532 | 4.46 | 4.07 | 3.84 | 3.69 | 3.58 | 3.50 | 3.44 
9 | 512 | 4.26 | 3.86 | 3.63 | 3.48 | 3.37 | 3.29 | 3.23 
10 | 4.96 | 410 | 3.71 | 3.48 | 3.33 | 3.22 | 3.14 | 3.07 
11 | 4.84 | 3.98 | 3.59 | 3.36 | 3.20 | 3.09 | 3.01 | 2.95 
12 | 4.75 | 3.89 | 34 | 3.26 | 3.11 | 3.00 | 2.91 | 2.85 
13 | 4.67 | 3.81 | 34 | 3.18 | 3.03 | 2.92 | 283 | 2.77 
14 | 4.60 | 3.74 | 3.34 | 3.11 | 2.96 | 2.85 | 276 | 2.70 
15 | 4.54 | 3.68 | 3.29 | 3.06 | 2.90 | 2.79 | 2.71 | 2.64 
16 | 4.49 | 3.63 | 3.24 | 3.01 | 2.85 | 2.74 | 2.66 | 2.59 
17 | 4.45 | 3.59 | 3.20 | 2.96 | 2.81 | 2.70 | 2.61 | 2.55 
18 | 4.41 | 3.55 | 3.16 | 2.93 | 2.77 | 266 | 2.58 | 2.51 
19 | 438 | 3.52 | 3.13 | 2.90 | 274 | 2.63 | 2.54 | 2.48 
20 | 435 | 3.49 | 3.10 | 2.87 | 2.71 | 260 | 2.51 | 2.45 
21 | 4.32 | 3.47 | 3.07 | 2.84 | 268 | 2.57 | 249 | 2.42 
22 | 430 | 3.44 | 3.05 | 2.82 | 266 | 2.55 | 2.46 | 2.40 
23 | 428 | 3.42 | 3.03 | 2.80 | 2.64 | 2.53 | 2.44 | 2.37 
24 | 4.26 | 340 | 3.01 | 2.78 | 2.62 | 2.51 | 2.42 | 2.36 
25 | 4.24 | 3.39 | 2.99 | 2.76 | 2.60 | 2.49 | 2.40 | 2.34 
26 | 4.23 | 3.37 | 2.98 | 2.74 | 2.59 | 247 | 2.39 | 2.32 
27 | 4.21 | 3.35 | 2.96 | 2.73 | 2.57 | 24 | 2.37 | 2.31 
28 | 4.20 | 3.34 | 2.95 | 2.71 | 256 | 2.45 | 236 | 2.29 
29 | 418 | 3.33 | 2.93 | 2.70 | 255 | 2.43 | 2.35 | 2.28 
30 | 417 | 3.32 | 2.92 | 269 | 2.53 | 2.42 | 2.33 | 3.27 
40 | 4.08 | 3.23 | 2.84 | 2.61 | 2.45 | 234 | 2.25 | 2.18 
60 | 400 | 3.15 | 2.76 | 2.53 | 237 | 2.25 | 217 | 2.10 
120 | 3.92 | 3.07 | 2.68 | 2.45 | 2.29 | 217 | 2.09 | 2.02 
c | 3.84 | 3.00 | 260 | 237 | 221 | 210 | 2.01 | 194 























S01 








本 下 
9 10 12 15 20 24 30 40 60 120 ce 
240.5| 241.9 | 243.9 | 245.9 | 248.0 | 249.1 | 250.1 | 251.1 | 252.2 | 253.3 | 254.3 
19.38| 19.40 | 19.41 | 19.43 | 19.45 | 19.45 | 19.46 | 19.47 | 19.48 | 19.49 | 19.50 
8.81| 8.79 | 8.74 | 8.70 | 8.66 | 8.64 | 8.62 | 8.59 | 8.57 | 8.55 | 8.53 
6.00 | 5.96 | 5.91 5.86 | 5.80 | 5.77 | 5.75 | 7.72 | 5.69 | 5.66 | 5.63 
4.77 | 4.74 | 4.68 | 4.62 | 4.56 | 4.53 | 4.50 | 4.46 | 4.43 | 4.40 | 4.36 
4.10| 4.06 | 4.00 | 3.94 | 3.87 | 3.84 | 3.81 | 3.77 | 3.74 | 3.70 | 3.67 
3.68 | 3.64 | 3.57 | 3.51 | 3.44 | 3.41 | 3.38 | 3.34 | 3.30 | 3.27 | 3.23 
3.39| 3.35 | 3.28 | 3.22 | 3.15 | 3.12 | 3.08 | 3.04 | 3.01 | 2.97 | 2.93 
3.18| 3.14 | 3.07 | 3.01 | 2.94 | 2.90 | 2.86 | 2.83 | 2.79 | 2.75 | 2.71 
3.02 | 2.98 | 2.91 2.85 | 2.77 | 2.74 | 2.70 | 2.66 | 2.62 | 2.58 | 2.54 
2.90 | 2.85 | 2.79 | 2.72 | 2.65 | 2.61 | 2.57 | 2.53 | 2.49 | 2.45 | 2.40 
2.80 | 2.75 | 2.69 | 2.62 | 2.54 | 2.51 2.47 | 2.43 | 2.38 | 2.34 | 2.30 
2.71 | 2.67 | 2.60 | 2.53 | 2.46 | 2.42 | 2.38 | 2.34 | 2.30 | 2.25 | 2.21 
2.65 | 2.60 | 2.53 | 2.46 | 2.39 | 2.35 | 2.31 | 2.27 | 2.22 | 2.18 | 2.13 
2.59 | 2.54 | 2.48 | 2.40 | 2.33 | 2.29 | 2.25 | 2.20 | 2.16 | 2.11 2.07 
2.54 | 2.49 | 2.42 | 2.35 | 2.28 | 2.24 | 2.19 | 2.15 | 2.11 | 2.06 | 2.01 
2.49 | 2.45 | 2.38 | 2.31 | 2.23 | 2.19 | 2.15 | 2.10 | 2.06 | 2.01 1.96 
2.46 | 2.41 | 2.34 | 2.27 | 2.19 | 2.15 | 2.11 2.06 | 2.02 | 1.97 | 1.92 
2.42| 2.38 | 2.31 | 2.23 | 2.16 | 2.11 | 2.07 | 2.03 | 1.98 | 1.93 | 1.88 
2.39| 2.35 | 2.28 | 2.20 | 2.12 | 2.08 | 2.04 1.99 | 1.95 1.90 | 1.84 
2.37| 2.32 | 2.25 | 2.18 | 2.10 | 2.05 | 2.01 1.96 | 1.92 | 1.87 | 1.81 
2.34| 2.30 | 2.23 | 2.15 | 2.07 | 2.03 | 1.98 1.94 1.89 1.84 | 1.78 
2.32| 2.27 | 2.20 | 2.13 | 2.05 | 2.01 1.96 1.91 1.86 | 1.81 1.76 
2.30 | 2.25 | 2.18 | 2.11 | 2.03 | 1.98 | 1.94 1.89 1.84 1.79 1.73 
2.28 | 2.24 | 2.16 | 2.09 | 2.01 1.96 | 1.92 1.87 1.82 1.77 | 1.71 
2.27| 2.22 | 2.15 | 2.07 | 1.99 | 1.95 1.90 1.85 | 1.80 1.75 | 1.69 
2.25| 2.20 | 2.13 | 2.06 | 1.97 | 1.93 | 1.88 1.84 |-1.79 1.73 | 1.67 
2.24| 2.19 | 2.12 | 2.04 | 1.96 | 1.91 1.87 | 1.82 | 1.77 | 1.71 1.65 
2.22| 2.18 | 2.10 | 2.08 | 1.94 | 1.90 | 1.85 | 1.81 1.75 | 1.70 | 1.64 
2.21 | 2.16 | 2.09 | 2.01 1.93 1.89 | 1.84 | 1.79 | 1.74 1.68 | 1.62 
2.12| 2.08 | 2.00 | 1.92 | 1.84 1.79 | 1.74 1.69 1.64 | 1.58 | 1.51 
2.04| 1.99 | 1.92 | 1.84 | 1.75 | 1.70 | 1.65 1.59 | 1.53 1.47 | 1.39 
1.96 | 1.91 1.83 | 1.75 | 1.66 | 1.61 1.55 | 1.50 | 1.43 | 1.35 1.25 
1.88 | 1.83 | 1.75 | 1.67 | 1.57 | 1.52 | 1.46 | 1.39 | 1.32 | 1.22 | 1.00 





-~ 
































附录 5 常用 正 交 表 
Ls(27) 


L.(2’) 








303 



























pp 一 一 一 一 一 一 一 一 
~ 一 中 中 局 局 一 0 py ones bi be ba 
站 sw-nrnnaanamawasnnmnaa 
om-naawo- -nom 
pc CC CC 
~|a |i- mmm S |- 
如 
A = EE CE EE 
-mm inn -non 
S| 
中 aa-mna-na-m-ma-mau-na-nan 
fh mm ronom 
刘 oo am aa aaa 
| EC 
中 
|- NAN mANN 
2 Inom~NNA NA No 
- -wa 
ao | saw--aesa---- 
ao -ooo 
-wa 
Ce CT 
| -NN 
: on 一 中 一 一 
| ornare 
S| = a- de 
El -saw-awa-- 一 -aa 
ww | -wan-aarm-aa 高 RC 
-| 而 
忌 
本 pl eaoaoe 
”0 中 NovoovoomadSI R33s 





Lazr(33) 








10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
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了 xs (5) 





| 
| 
Te 
Ee 
EO 
RE 
路 

Rp nmr ovoadiS see2RsNN 





Liz(6' X2:) 


Li (3' X2:) 





局 一 局 一 中 一 


一 AnmeNaN 


一 一 中 一 一 


AQaaa 一 一 


10 
11 
12 








一 com 


10 
11 


12 


"0 = 


附录 6 回归 正 交 设计 表 












































1) 一 次 回归 正 交 表 
(1) 三 因子 一 次 回归 正 交 表 及 计算 方法 
试验 号 | XX。 xX X: X | XX 一 XX | Xs 一 XIX | Xs 一 XiuXi | 试验 数据 y 
1 =1 =1 =1 1 1 I Y 
2 1 一 1 -1 1 1 一 1 一 1 了 
3 1 一 ! 1 一 1 一 1 1 一 1 有 
4 1 一 ! 1 -1 1 7 
5 1 1 一 1 一 1 1 
6 1 1 -1 | 1 -1 Y 
了 1 1 1 | 一 1 -1 YY 
8 1 1 1 1 1 Ys 
0 9 
已 ty | Dray, Drsys | Droy, 
1 台 
d, 8 8 8 
和 | 和 = 所 |o= 生 | 呈 = 皇 | = 和 | = 全 | = 上 | 和 = 要 


回归 方程 的 形式 : $ = 十 btl 十 barz 十 byx3 十 bys 十 bsrs 十 bere 


(2) 四 因子 一 次 回归 正 交 表 及 计算 方法 



























































变 出 
试验 身 \| | 各 | 大 | 大 | 闷 
1 时 = 1 -LE | 
2 1|-|-|-| 1 
3 1 1-1|-1| 1|- 
4 1 |-1|-1| 1| 1 
5 1 一 1 1 =] 一 1 
6 1 |-1| 1|-1| 1 
7 1 -el 1 1 < 
8 1|-| 1| 1| 1 
9 1 1 一 rp 一 
10 1 和 = < 1 
11 1 1|-1| 1|-1 
12 1 a 
13 1 1| 1|-1|-i 
14 1 二 了 Ca 下 
15 1 1 1 1 一 上 
16 Ye 1 1 I 
B [Bl|B IB | | 
d, 16 16 16 16 16 
加 hh | 各 | | 











上 
B 一 royG=0.1.2,3,4.5,6,7.8.9,10)， 轧 = 到 = : 
台 ， 


回归 方程 的 形式 : $ = 入 十 铀 十 谢世 十 遍 扫 十 碎 三 十 的 ri 十 语 Ti 十 的 开工 十 的 To 十 by 十 所 03 
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2) 二 次 回归 正 交 表 
























































(1) 二 因子 二 次 回归 正 交 表 及 计算 方法 
一 一 一 
本 A|B Xo Xl Xz Xs=3(X9 一 皇 ) 和 =308- 人 | Xs=Xxe |Y 
1 [= 二 =1 1 1 Y 
2 | ol-i 一 2 1 0 Ys 
3| 1|-i 1 1 -1 Ys 
4|-1| 0o 和 一 2 0 Ys 
5| ol。 一 2 一 2 0 Ys 
6| 1|0 1 一 2 0 Ys 
7|-1| 1 1 1 -1 YY 
8| ol 1 一 2 1 0 Ys 
9| 1 1 1 1 Yo 
T 9 9 9 
Bi |Bo B= Pry | BPry | B= 
四 18 18 4 
-Bb Bs 一 了 -Bs 
| 护 | 如 = 写 如 一 一 证 本 一 此 
回归 方程 的 形式 ， 


他 二 bozo 十 也 Ti 十 barz 十 byz3 十 byz4 十 所 Zs 二 bo 十 bi 十 如 zz 十 的 GC# -也 ) J]+a E (好 


(2) 三 因子 二 次 回归 正 交 表 及 计算 方法 


























斌 Ee Xs = X= 
ea et sh 0 好 一 073 073|Y 
1 1 1 1 0.27 0.27 Yl 
2 1 i 0.27 0.27 3 
3 1 和 0.27 0.27 2 
4 1 1 0.27 0.27 Ye 
5 1 1 0.27 0.27 Ys 
6 1 h 0.27 0.27 Ye 
学 昌 二 0.27 0.27 np 
8 1 1 0.27 0.27 Ys 
可 和 0 一 0.73 一 0.73 Ys 
10 1 0 一 0.73 0.73 Yio 
11 1 0 0.746 一 0.73 | Yu 
12 中 0 0.746 一 0.73 Yiz 
13 1 0 一 0.73 0.74 Ys 
14 1 0 一 0.73 0.746 |Y4 
15 | 1 0 一 0.73 一 0.736 |Yl5 
B| Bm 加 加 B 

dj 15 8 4.36 4.36 

“| -各 Cd 















































回归 方程 的 形式 := 如 二 二 二 4 十 … 十 的 到 一 加 十 身 瑟 十 如 三 十 的 区 十 胃 2 瑟 至 十 
B3173 + bear2r3 十 1( 节 一 0.73) 十 boz( 荫 一 0.73) 十 ba3( 玛 一 0.73) 
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oh 一 4: 平 得 因 王 尘 鱼 回 
一 HH9 十 … 十 红 人 9 十 十 trtg 十 史 
(8°0— H++ lzlg+m+ tig+ og | 























1g 
: 区 和 8 对 
四 
52 
到 
E73 全 
zz 
和 I 
和 0 
6l 
% 8l 
4l 
4 9 
4 sl 
人 yl 
和 8 
Zl 
SA 1 
x 8 
Ix 
ox . 
ox 
中 
以 : 
中 
外 
以 
这 
各 三 并 
> xix | zxix | oxix | xx | xx | ， x 下 
¢ |80 一 史 |80- 史 |80 一 到 Sa 兴 2 : 二 二 By > 
ny ax arx x 


















































梁 企 次 其 及 举 涉 王 包 回 竣 二 士 国 区 (8) 


1 
oo 
之 
Ba 

1 


ABCDEFG 
BCDEFGA 
CDEFGAB 
DEFGABC 
EFGABCD 
FGABCDE 
GABCDEF 


附录 7 正 交 拉丁 方 表 
正 交 拉丁 方 的 完全 系 


3X3 


了 I 


ABCDEFG ABCDEFG ABCDEFG 
CDEFGAB DEFGABC EFGABCD 
EFGABCD GABCDEF BCDEFGA 
GABCDEF CDEFGAB FGABCDE 
BCDEFGA FGABCDE CDEFGAB 
DEFGABC BCDEFGA GABCDEF 
FGABCDE EFGABCD DEFGABC 


I I 


ABCDEFGH ABCDEFGH 
BADCFEHG EFGHABCD 
CDABGHEF BADCFEHG 
DCBAHGFE FEHGBADC 
EFGHABCD GHEFCDAB 
FEHGBADC CDABGHEF 
GHEFCDAB HGFEDCBA 
HGFEDCBA DCBAHGFE 


V 
ABCDEFGH 
DCBAHGFE 
HGFEDCBA 
EFGHABCD 
FEHGBADC 
GHEFCDAB 
CDABGHEF 
BADCFEHG 


8x8 
也 


VY 
ABCDEFGH 
FEHGBADC 
DCBAHGFE 
GHEFCDAB 
CDABGHEF 
HGFEDCBA 
BADCFEHG 
EFGHABCD 


ABCDEFGH 
GHEFCDAB 
EFGHABCD 
CDABGHEF 
HGFEDCBA 
BADCFEHG 
DCBAHGFE 
FEHGBADC 


V 
ABCDEFG 
FGABCDE 
DEFGABC 
BCDEFGA 
GABCDEF 
EFGABCD 
CDEFGAB 


N 
ABCDE 
BAECD 
CDAEB 
DEBAC 
ECDBA 


W 
ABCDEFG 
GABCDEF 
FGABCDE 
EFGABCD 
DEFGABC 
CDEFGAB 
BCDEFGA 


N 


出 
ABCDEFGH 
CDABGHEF 
FEHGBADC 
HGFEDCBA 
BADCFEHG 
DCBAHGFE 
EFGHABCD 
GHEFCDAB 


ABCDEFGH 
HGFEDCBA 
GHEFCDAB 
BADCFEHG 
DCBAHGFE 
EFGHABCD 
FEHGBADC 
CDABGHEF 


"0 


附录 8 MATLAB 常用 操作 符 与 函数 


附 表 8-1 操 作 符 





操作 符 功 能 操作 符 功 能 
四 加 空格 分 隔 符 
村 减 分 隔 符 
乘 小 数 点 
乘 宕 ; 结尾 标志 或 分 隔 符 
左 除 冒号 运算 符 
右 除 % 注释 号 
赋值 号 bi 字符 串 记述 符 
小 于 0 圆 括号 
大 于 0 方 括号 
小 于 或 等 于 & 逻辑 与 
大 于 或 等 于 1 逻辑 或 
等 号 ~ 逻辑 非 
不 等 号 xor 逻辑 异 








附 表 8-2 操作 指令 























help 

clear 

quit 

clc 

disp 

hold 

Format short 


Format long 


在 线 帮助 (显示 在 命令 行 ) 
清除 Matlab 工作 空间 中 保存 的 变量 


退出 Matlab 
清除 工作 窗 


显示 变量 或 文字 内 容 
图 形 保持 开关 
数字 格式 ,5 位 有 效 数字 


数字 格式 ,15 位 有 效 数字 





附 表 8- 3 控制 流 及 交互 式 输入 








条 件 判断 
条 件 判断 
条 件 判 断 
循环 语句 
循环 语句 
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( 续 表 ) 








switch 分 支 语 句 
case | switch 条 件 判断 . 
otherwise 默认 switch 条 件 
break while, for 的 循环 中 断 语 句 
end for，while，switch 和 让 语句 的 结束 标志 
return 返回 函数 
input 提示 用 户 输入 
pause | ”运行 暂停 
和 
附 表 8-4 图 形 化 常用 语句 
plot 散 点 图 
bar 条 形 图 
hist 直方 图 
pie 饼 图 
loglog 双 对 数 坐标 图 
semilogx 半 对 数 坐标 图 
semilogy 半 对 数 坐标 图 
title 书 ? ” 
xlabel 横 坐 标 轴 名 
ylabel 纵 坐 标 轴 名 
legend 标注 图 例 
text 标注 文本 坐标 
gtext | ”用 鼠标 选择 文本 标注 的 位 置 
grid 是 否 画 分 格 线 的 双向 切换 指令 
grid on 画 出 分 格 线 
grid off 不 画 分 格 线 
box 坐标 形式 在 封闭 式 和 开启 式 之 间 切 换 指令 
box on 使 当前 坐标 呈 封 闭 形式 
box off 使 当前 坐标 呈 开 启 形式 
hold 当前 图 形 是 否 可 刷新 的 双向 切换 开关 
hold on 保持 当前 图 形 不 被 刷新 
hold off 当前 图 形 不 被 保持 ,可 刷新 
subplot(m, n, p) 把 一 个 绘图 窗口 划分 为 mXn 个 子 绘图 区 域 , 通 
过 参数 p 调用 各 子 绘图 区 域 
fplot(fun, lims) 绘制 函数 图 ,lims 为 指定 函数 fun 在 x 轴 的 区 间 


pe 


附 表 8- 5 数据 分 析 与 数学 函数 











max(A) 数组 中 的 最 大 元 素 cos(x) 余弦 函数 
min(A) 数组 中 的 最 小 元 素 tan(x) 正切 函数 
mean(A) 求 平均 值 exp(x) | 指数 函数 
var( A) 求 方差 log(x) 自然 对 数 函数 
std(A) 标准 差 log10(x) 以 10 为 底 的 对 数 函数 
sort(A) 以 升序 排序 abs(x) 求 绝对 值 
sin(x) 正弦 函数 sqrt(x) 求 平方 根 
附 表 8-6 向 量 与 矩阵 

linspace 生成 线性 等 分 n 维 向 量 

dot(a. b) 两 向 最 点 积 

cross(a, b) | 两 向 量 叉 积 

AxB 矩阵 相 乘 

A.#*B 数组 相 乘 

A/B 矩阵 右 除 ,A* B 

A\B 矩阵 左 除 ,A-B 

A./B 数组 右 除 

A.\B 数组 左 除 

size( A) 和 矩阵 的 大 小 

length(A) | 数组 的 长 度 

ndims( A) 和 矩阵 的 维 数 

zeros(M，N) 或 zeros (N) | 生成 MXN 阶 或 NXN 的 全 0 阵 

eye(M，N) 或 eye(N) 生成 MXN 阶 或 NXN 的 单位 阵 

ones( M,N) 或 ones(N) 生成 MXN 阶 或 NXN 的 全 1 阵 

rand(M，N) 或 rand(N) 生成 MXN 阶 或 NXN 的 随机 阵 

norm(A) 和 矩阵 或 向 量 的 范 数 

rank(A) 矩阵 的 秩 

det(A) 矩阵 行列 式 的 值 

inv(A) 矩阵 的 逆 

diag(A) 抽取 主 对 角 线 元 素 向 量 

tril(A) 提取 矩阵 的 主 下 三 角 部 分 

triu(A) 提取 和 矩阵 的 主 上 三 解 部 分 

diag( A, k) 抽取 和 矩 阵 第 k 条 对 角 线 的 元 素 向 量 。k 一 0 为 抽取 主 对 角 线 ,k 为 

正 值 时 为 上 方 第 k 条 对 角 线 ,k 为 负 值 时 为 下 方 第 k 条 对 角 线 
tril(A, k) 提取 和 矩阵 第 k 条 对 角 线 下 面部 分 
triu(A, k) 提取 矩阵 第 k 条 对 角 线 上 面部 分 


te 1 A 





附 表 8-7 数据 处 理 中 的 常用 内 置 函 数 








fzeroC F', x, tol, trace) 


fsolveC F', x0 , options) 


yi=interpl (x, y, 
xi, ' method') 


y0= spline(x, y, x0) 
diff(x) 


pp 一 csape(x，y， 
"conds'，valconds) 


Y=fnder(f，dorder) 
ppval(pp，x) 
cumsum(x) 
cumsum( x, dim) 


Z=trapz(X, Y) 
Z=trapz(X, Y, dim) 
Q=quadCF' av b 
tol，trace) 


Q= quad8( fun', a, b, 

tol, trace) 

feval(fun, x0) 

[T, YJ]=ode23( F', tspan, 
y0, options) 


[T, YJ]=ode45( F', tspan, 
y0, options) 





求 非 线 性 方程 的 解 

下 是 {(x) 的 名 称 ,x 是 初始 估计 值 ,返回 靠近 x 点 ,f(x)==0 
时 的 横 坐 标 值 。tol 为 设置 收敛 判断 的 相对 误差 ,trace 
不 为 零 将 显示 中 间 结 果 , tol、trace 取 默 认 值 时 输入 空 
矩阵 

求 非 线 性 方程 (组 ) 的 解 

F 为 函数 名 ,x0 为 初 值 窍 阵 ,options 为 以 向 量 表示 的 可 选 
参数 值 

一 维 插值 ,对 一 组 节点 (x, y) 进 行 插值 ,计算 插值 点 xi 的 
函数 值 。x 为 节点 向 量 值 ,y 为 对 应 的 节点 函数 值 
method 可 以 取 以 下 值 : nearest 最 近 插 值 , linear 线性 插 
值 ,spline 三 次 样 条 插值 ,cubic 三 次 插值 

利用 三 次 样 条 插值 法 寻找 在 插值 点 x0 处 的 插值 函数 y0， 
插值 函数 根据 输入 的 参数 x 和 y 的 关系 得 来 

计算 数组 间 元 素 的 差分 ,返回 的 结果 为 [x(2) 一 x(1)， 
x(3) 一 x(2)，…x(n) 一 xCn 一 1)] 

其 中 (x, y) 为 插值 点 的 序列 ,pp 为 指定 条 件 下 以 (x，y) 为 
插值 点 所 返回 的 三 次 样 条 函数 , conds 为 边界 条 件 ， 
valconds 为 边界 值 

返回 样 条 函数 的 第 dorder 阶 微分 ,默认 为 1 

计算 在 节点 处 x 样 条 函数 pp 的 值 

和 矩形 求 积分 公式 ,对 于 向 量 x, 返 回 一 结果 向 量 , 对 于 矩阵 
则 返回 一 矩阵 ,矩阵 的 列 即 为 对 应 x 的 列 的 累积 和 返回 
值 . 参数 dim 指 求 和 是 从 第 dim 维 开始 求 和 

使 用 梯形 法 计算 Y 对 X 的 积分 值 


使 用 Simpson 方法 求 函 数 F 从 a 到 bb 的 积分 近似 值 ,tol 
为 积分 精度 ,trace 不 为 0 时 则 做 出 积分 函数 'F' 的 积分 
图 ,否则 不 做 

使 用 牛顿 - 科 特 斯 法 求 积 分 公式 。 其 中 参数 的 定义 与 quad 
函数 相同 

求 函 数 fun 在 x0 的 函数 值 

二 三 阶 龙 格 一 库 塔 法 求解 常 微分 方程 的 函数 。 其 中 下 定 
义 此 微分 方程 的 形式 为 y' 一 F(t，y) ,tspan 一 [to tfinal] 
表示 积分 限 是 从 t0 到 tfinal, 也 可 以 表示 一 些 离散 的 点 
tspan 一 [t0 d … tfinal]. y0 为 初始 条 件 。Options 为 积 
分 参数 

四 五 阶 龙 格 一 库 塔 法 求解 常 微分 方程 的 函数 。 参 数 定义 
与 ode23 相同 








= 二 9 


( 续 表 ) 





[H, sig]=ztest(X, M, sigma, 
alpha, tail) 


[H, sig]=ttest(X, M, sigma, 
alpha, tail) 


y=polyval(P, X) 
p= polyfit(x, y, n) 


[b, bint, r, rint, stats]= 
regress(y, x, alpha) 


[beta, R, J] = nlinfit (xdata, 
ydata, ' model'’, beta0) 


x 一 1sqcurvefit( f{', x0, 
xdata, ydata) 





o 已 知 时 的 检验 (U 检验 法 )。 当 标准 差 sigma 已 知 时 ， 
函数 执行 一 正 态 检验 来 判断 是 否 来 自 一 正 态 分 布 的 样 
本 的 期 望 值 。M 作为 评判 标准 来 估计 。 默 认 值 alpha 一 
0.05, tail=0. 当 tail=0 时 , 备 择 假设 为 “期 望 值 不 等 于 
M”,tail=1 时 ,为 “期 望 值 大 于 M”, tail= 一 1 时 ,为 “期 
望 值 小 于 M”。alpha 为 设 定 的 显著 水 平 ,H=0 表示 在 
显著 水 平 为 alpha 的 情况 下 ,不 能 拒绝 原 假设 ,H= 1 表 
示 可 以 拒绝 原 假设 

o 未知 时 的 p 检验 (t+ 检验 法 ) 
参数 说 明 同上 

计算 自 变量 值 等 于 X 时 多 项 式 的 值 ,多 项 式 的 形式 为 
Y=P(D *X° N+P(2) * X(N—1)+…+P(N) > 
X 十 P(N 十 1) ,向 量 P 为 N 十 1 阶 系数 向 量 

对 所 给 的 x, y 数据 进行 多 项 式 拟 合 ,n 为 次 数 ,n= 二 1 时 为 
线性 拟 合 ,p 返回 的 是 n 十 1 阶 的 系数 向 量 

对 所 给 的 x, y 数据 进行 显著 水 平 为 alpha 的 多 元 线性 拟 
合 ,返回 值 中 向 量 b 为 各 系数 ,bint 为 ((k 十 1) * 2) 维 数 
组 ,存放 置信 下 限 BR. 和 上 限 pu,r 为 残 差 ,rint 为 残 差 的 
置信 区 间 。stats 一 [R:Fop]，R 为 相关 系数 ,Fo 为 检 
验 统计 量 ,p 为 对 应 Fo 的 p 值 

Gauss-Newton 法 的 非 线性 最 小 二 乘法 拟 合 。xdata, ydata 
为 进行 拟 合 的 数据 ,model 为 拟 合 的 数学 模型 ,beta0 为 
所 求 系数 的 初 值 

同 为 非 线 性 最 小 二 乘法 拟 合 ,f 为 拟 合 模型 ,x0 为 模型 参 
数 初 值 
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